2014 dxdy logo

Научный форум dxdy

Математика, Физика, Computer Science, Machine Learning, LaTeX, Механика и Техника, Химия,
Биология и Медицина, Экономика и Финансовая Математика, Гуманитарные науки





Начать новую тему Ответить на тему На страницу Пред.  1, 2, 3, 4, 5, 6  След.
 
 Re: Перспективы инженерии знаний и онтологий в частности
Сообщение12.11.2013, 20:36 


20/09/09
685
Уфа
На Хабре опубликовали статью про "Латентно-семантический анализ" и "Латентно-семантический анализ и поиск на python".

 Профиль  
                  
 
 Re: Перспективы инженерии знаний и онтологий в частности
Сообщение21.05.2014, 18:57 


20/09/09
685
Уфа
ABBYY представляет первые решения на базе технологии Compreno – для корпоративного поиска и извлечения данных.
http://www.abbyy.ru/Default.aspx?DN=2d53227a-1105-4e71-b1f8-a68d1664a4ef

(Оффтоп)

Москва, 9 апреля 2014 года – компания ABBYY выпускает решения для корпоративного поиска и извлечения данных на базе технологии понимания, анализа и переводов текстов ABBYY Compreno. ABBYY Intelligent Search позволяет с высокой точностью искать документы, основываясь на понимании смысла текста. ABBYY Intelligent Tagger автоматически извлекает дополнительную информацию о документах для упрощения дальнейшей работы с ними – поиска, классификации, сортировки и анализа.

«Сегодняшний анонс – это новый этап в истории компании. Мы верим, что будущее за лингвистическими технологиями анализа и понимания смысла текста. Решения на базе этих технологий будут способны изменить эффективность корпоративных информационных систем», – комментирует Сергей Андреев, президент и генеральный директор группы компаний ABBYY.

Количество данных в мире удваивается каждые 12-18 месяцев1. 80% данных являются неструктурированными и, как следствие, их поиск, анализ и обработка крайне затруднены. Невозможность полноценно использовать этот информационный «балласт» повышает расходы организаций и понижает качество принятия решений. По данным международной Ассоциации специалистов по управлению данными AIIM2, более 60% ИТ-менеджеров считают инструменты поиска неудовлетворительными. Несмотря на это, согласно отчету IDC3, объем мирового рынка корпоративного поиска в 2014 году составит 2 миллиарда долларов, а появление более эффективных инструментов может значительно увеличить его размер.

Исследование IDC показывают, что в компаниях на поиск документов и сбор информации работники умственного труда в среднем тратят более 17 часов в неделю. Около 3 часов из них приходится на создание дубликатов уже существующей информации, упущенной при поиске. При внедрении систем корпоративного поиска нового поколения, которые будут работать с данными на уровне их смыслового анализа, сотрудники могут сократить время поиска необходимой информации в два раза, а объём сэкономленных средств для крупной компании cможет достигать десятков миллионов долларов в год.

Первое решение, ABBYY Intelligent Search, предоставляет результаты поиска с высокой релевантностью, поскольку благодаря технологии Compreno учитывает не только все формы слов, но и их значения, смысловые связи между словами и контекст употребления. Такой подход позволяет значительно повысить эффективность поиска по сравнению с традиционными системами, которые ищут данные по ключевым словам. ABBYY Intelligent Search позволит решать на новом уровне самый широкий спектр задач, связанных с поиском информации. Например, можно улучшить его качество для всех сотрудников организации как в обычных файловых хранилищах, так и в корпоративных информационных порталах, организованных на базе Microsoft SharePoint или других ECM-систем. Также актуальными являются задачи предоставления более релевантных поисковому запросу результатов на корпоративных сайтах компаний и повышения эффективности работы сотрудников службы поддержки при поиске ответов на вопросы пользователей.

Второе из представленных решений, ABBYY Intelligent Tagger, автоматически собирает метаданные и находит в тексте документов сущности (названия организаций, персон, гео-объекты, даты и денежные суммы), дополняя таким образом документы информацией, на базе которой можно проводить их дальнейшую классификацию, сортировку или фильтрацию. Используя выявленные сущности, можно качественно улучшить целый ряд организационных процессов, связанных с анализом содержимого и ключевых параметров документов. Например, повысить приоритет обработки документов, поступающих от самых важных клиентов, создать правила для автоматического сбора сведений о клиенте или партнере, оптимизировать маршрутизацию документа по определенным критериям бизнес-процессов, упростить очистку документов от персональных и конфиденциальных данных.

Оба решения в настоящий момент поддерживают английский и русский языки. Более подробная информация о них доступна на сайте ABBYY.

«Технология, разработанная Резидентом Сколково ООО "Аби Инфопоиск", лежит на стыке двух важнейших форсайтов IT Кластера - новые системы поиска и распознавания и обработка и анализ больших массивов данных. Использование семантики при анализе данных - сложнейшая задача, решение которой требует серьезной концентрации времени и ресурсов. Именно поэтому, прорыв, реализованный в Сколково командой ABBYY особенно важен для нас: в данном направлении в Кластере работают несколько Резидентов и, помимо вдохновляющего примера, мы ожидаем синергетического эффекта при дальнейшем развитии технологии ABBYY на глобальном рынке», – комментирует Игорь Богачев, исполнительный директор кластера информационных и компьютерных технологий Фонда «Сколково».

 Профиль  
                  
 
 Re: Перспективы инженерии знаний и онтологий в частности
Сообщение17.12.2014, 22:26 


20/09/09
685
Уфа
На Хабре опубликовали статью о извлечении информации из неструктурированного текста, использовании технологии Compreno, онтологиях и т.д.:
Онтоинженер: работа по понятиям.

 Профиль  
                  
 
 Re: Перспективы инженерии знаний и онтологий в частности
Сообщение19.12.2014, 17:05 


20/09/09
685
Уфа
В Википедии есть статья Теория "Смысл-Текст" про историю работ по машинному переводу в СССР (под руководством Мельчука).

 Профиль  
                  
 
 Re: Перспективы инженерии знаний и онтологий в частности
Сообщение19.12.2014, 17:13 
Заблокирован
Аватара пользователя


07/08/06

3474
Rasool, а Вы не могли бы снабжать ссылки собственным кратким описанием статьи, на которую ссылаетесь? Это было бы более интересно нам и полезно - Вам.

 Профиль  
                  
 
 Re: Перспективы инженерии знаний и онтологий в частности
Сообщение20.12.2014, 22:59 


20/09/09
685
Уфа
Помимо ABBYY в России существуют еще компании, занимающиеся компьютерной лингвистикой: Russian Context Optimizer. В ссылке приведены ссылки на научные публикации работников этой компании. Так что не ABBYY единым.

 Профиль  
                  
 
 Re: Перспективы инженерии знаний и онтологий в частности
Сообщение21.12.2014, 00:09 
Заблокирован
Аватара пользователя


07/08/06

3474
Может, Вам покажется ещё интересной книга - Лукашевич Н. В. "Тезаурусы в задачах информационного поиска", там информация изложена в достаточно доступной форме.

 Профиль  
                  
 
 Re: Перспективы инженерии знаний и онтологий в частности
Сообщение21.12.2014, 14:37 


20/09/09
685
Уфа
AlexDem в сообщении #950153 писал(а):
Может, Вам покажется ещё интересной книга - Лукашевич Н. В. "Тезаурусы в задачах информационного поиска", там информация изложена в достаточно доступной форме.

Спасибо, у меня уже есть эта книга. Есть также книга Лапшин В.А. Онтологии в компьютерных системах.

 Профиль  
                  
 
 Re: Перспективы инженерии знаний и онтологий в частности
Сообщение21.12.2014, 15:38 
Заблокирован
Аватара пользователя


07/08/06

3474
Лапшина не читал, зато смотрел Падучеву "Высказывание и его соотнесенность с действительностью" (1985 года), но там достаточно сложный материал. У неё [с. 15 внизу] есть такое утверждение, что анализ модальных понятий в классической логике невозможен. А вот в статье Вики про Дескрипционные логики пишут, что в 1991 году было замечено, что ДЛ ALC есть не что иное, как записанная в других обозначениях модальная логика Kn, имеющая n независимых модальностей. И там же есть раздел о связи ДЛ ALC с логикой предикатов. Так что выводы Падучевой могли устареть (хотя я не настолько ориентируюсь в логике, чтобы сказать наверняка), а другой настолько же фундаментальной книги мне не попадалось.

А у Лукашевич очень хороша часть $2$ - формальные и лингвистические онтологии, где показана разница между онтологиями, в основе которых - логика (я бы назвал - формальные), и онтологиями, построенными на основе системы классов (соответственно - прикладные).

 Профиль  
                  
 
 Re: Перспективы инженерии знаний и онтологий в частности
Сообщение02.01.2015, 21:54 


20/09/09
685
Уфа
PAV в сообщении #342894 писал(а):
Rasool
самый разумный путь - это походить по сайтам специализированных компаний или поискать научные коллективы. В первом случае начинайте с раздела вакансий. Очень часто на сайтах приглашают написать даже в том случае, если Вы не нашли подходящую вакансию. Это совершенно нормально: Вы вполне можете написать, что Вам интересны такие-то области, Вы хотите научиться чему-то новому и т.д. С Вами вполне могут пообщаться, разъяснить, каковы реальные перспективы, и даже взять на работу, где Вы очень быстро сами оцените реально положение дел.

Все прочее, в том числе и советы общего характера, которые Вам могут дать на форумах - это малосодержательно.

Что касается моих личных перспектив в компьютерной лингвистике, то тут все неопределенно. В Уфе этим никто специально не занимается, нужно ехать в Москву или Питер в крайнем случае. А там возникают проблемы житейского плана: где найти и как оплатить жилье (если устроиться в компанию типа ABBYY, то можно снимать комнату, а если устроиться в вуз, то остается только общага). Одна моя знакомая поступила в аспирантуру в Питере, живет в общежитии, сейчас пишет диссертацию, параллельно подрабатывает.
Но у компьютерной лингвистики есть преимущество: системы можно ваять почти "на коленках", попутно делать публикации, например, в сборнике конференции "Диалог".

 Профиль  
                  
 
 Re: Перспективы инженерии знаний и онтологий в частности
Сообщение04.01.2015, 20:56 
Заблокирован
Аватара пользователя


07/08/06

3474
А чем Вы занимаетесь сейчас и какое у Вас образование? А то ведь можно волонтёром и удалённо попробовать набиться (у меня такой опыт есть, правда, ни во что особо не вылившийся). Чтобы на "Диалог" приняли статью, это ещё нужно постараться вроде бы, если нет опыта написания статей, можно попробовать куда попроще. Например, есть RCDL, там и рецензенты достаточно хорошие, и в то же время - порог вхождения пониже.

 Профиль  
                  
 
 Re: Перспективы инженерии знаний и онтологий в частности
Сообщение04.01.2015, 21:25 


20/09/09
685
Уфа
AlexDem в сообщении #956431 писал(а):
А чем Вы занимаетесь сейчас и какое у Вас образование?

У меня образование "Электроника", работаю программистом Delphi в одной маленькой фирме. Насколько я слышал, в ABBYY программируют на C#.
Есть опыт публикации статей в местном ВАК-ском журнале.

 Профиль  
                  
 
 Re: Перспективы инженерии знаний и онтологий в частности
Сообщение04.01.2015, 21:30 
Заблокирован
Аватара пользователя


07/08/06

3474
А зачем Вам этот ABBYY? Вас туда если и возьмут, то на какие-нибудь задворки, как человека без опыта. Где Вы и сгинете как несостоявшийся лингвист. Лучше, как мне кажется, попробовать прибиться к небольшому коллективу в академической среде, где нужны услуги программиста, интересующегося тематикой.

 Профиль  
                  
 
 Re: Перспективы инженерии знаний и онтологий в частности
Сообщение05.01.2015, 18:13 


20/09/09
685
Уфа
Думаю, в первую очередь нужно будет сделать публикации, чтобы заметили, а для этого нужно как следует поработать длительное время.

 Профиль  
                  
 
 Re: Перспективы инженерии знаний и онтологий в частности
Сообщение05.01.2015, 18:30 
Заблокирован
Аватара пользователя


07/08/06

3474
Я считал так же, но тот материал, который писал из этих же соображений, так до сих пор и не опубликован (хотя я не теряю надежды его довести). Вашего интереса к теме будет достаточно, как мне кажется. Если в принципе людей интересует какое-либо сотрудничество. А так получится скорее всего, что тематика Ваших статей не совсем совпадает с их профилем деятельности. Тем более, что в принципе статьи у Вас уже есть.

Кстати, я упустил кое-что, сказав, что волонтёрская деятельность не принесла результата. Так было в первый раз. Зато потом мне довелось выполнять часть исследовательской работы (как я понял - параллельно с основными исполнителями на случай, если получится что-то лучшее). Это было что-то вроде испытательного задания и помогло мне устроиться, куда я хотел (хотя этот случай не совсем показательный - задание давалось уже с прицелом на устройство). Но вообще говоря, ничто не мешает обойтись без второй фазы (непосредственно устройства). Всё зависит от ситуации, как мне кажется, где какие люди.

 Профиль  
                  
Показать сообщения за:  Поле сортировки  
Начать новую тему Ответить на тему  [ Сообщений: 85 ]  На страницу Пред.  1, 2, 3, 4, 5, 6  След.

Модераторы: maxal, Karan, Toucan, PAV, Супермодераторы



Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей


Вы не можете начинать темы
Вы не можете отвечать на сообщения
Вы не можете редактировать свои сообщения
Вы не можете удалять свои сообщения
Вы не можете добавлять вложения

Найти:
Powered by phpBB © 2000, 2002, 2005, 2007 phpBB Group