, 28 2012 . 16:31
( )
+
31 . , , , .
, , . - , - , -, - , . . : , , computer science, , - , , , .
, - ( ) . , .
- , : , - , .
:
http://habrahabr.ru/post/119352/ , , - . , - , ( - ), , , .
!
http://ru-ir.livejournal.com/127255.html
<a href="http://www.liveinternet.ru/users/lj_ru_ir/post220424442/">RuSSIR: последний шанс</a><br/>Осталась всего неделя до конца приема заявок на RuSSIR.Между тем, на сайте школы опубликована окончательная программа: http://romip.ru/russir2012/section.php?id=127Напоминаем, что основной темой этого года стали многоязычные приложения. А в самом начале школы будет проведен мини-курс "Ведение в информационный поиск". http://ru-ir.livejournal.com/127097.html... <a href="http://www.liveinternet.ru/users/lj_ru_ir/post220424442/">Читать далее...</a>
, 17 2012 . 11:27
( )
+
<a href="http://www.liveinternet.ru/users/lj_ru_ir/post220343535/">Анализ текста на естественном языке, управляемый вариантами разбора</a><br/>Уважаемые коллеги,19 мая состоится заключительный семинар по автоматической обработке естественного языка в этом сезоне.С докладом на тему "Анализ текста на естественном языке, управляемый вариантами разбора" выступит аспирант факультета вычислительной математики и кибернетики МГУ Алексей Носков.Общепринятой схемой обработки теста на естественном языке (ЕЯ) является последовательность независимых этапов его анализа на основных уровнях, включая графематический, морфологический и синтаксический анализ. На каждом этапе в общем случае возникают многочисленные варианты разбора отдельных единиц текс... <a href="http://www.liveinternet.ru/users/lj_ru_ir/post220343535/">Читать далее...</a>
, 16 2012 . 20:36
( )
+
,
19 .
" , " .
() , , . , , , .
, , , , . - , LSPL (
www.lspl.ru ) JAPE ( GATE:
www.gate.ac.uk ).
:
10 .. 49, 308 .
17:00. : " ".
http://ru-ir.livejournal.com/126961.html
<a href="http://www.liveinternet.ru/users/lj_ru_ir/post220343534/">RCDL 2012</a><br/>Наступила последняя неделя приёма расширенных тезисов докладов на XIV Всероссийскую научную конференцию RCDL-2012"Электронные библиотеки: перспективные методы и технологии, электронные коллекции", которая пройдёт в г. Переславль-Залесский, 15 - 18 октября 2012 года.Каждая работа будет тщательно изучена и отрецензирована несколькими членами программного комитета. Не позднее 24 июня программный комитет сообщит Вам о своём решении. В случае принятия доклада Вы сможете за лето подготовить окончательную публикацию по шаблонам в форматах DocX, ODT и LaTeX, доступным с сайта конференции.Очень надеем... <a href="http://www.liveinternet.ru/users/lj_ru_ir/post220343534/">Читать далее...</a>
, 15 2012 . 19:01
( )
+
<a href="http://www.liveinternet.ru/users/lj_ru_ir/post219578606/">Семинар Михаила Агеева «Моделирование успешного поиска на основе поведения пользователя»</a><br/>Семинар состоится 23 мая 2012 года в московском офисе Яндекса.В рамках Цикла научных семинаров выступит Михаил Агеев, кандидат физико-математических наук (с 2005 г.), старший научный сотрудник научно-исследовательского вычислительного центра МГУ им. М.В.Ломоносова.Работа, в которой Михаил был основным автором получила приз, как лучшая работа на SIGIR 2011. http://ru-ir.livejournal.com/126334.html... <a href="http://www.liveinternet.ru/users/lj_ru_ir/post219578606/">Читать далее...</a>
, 11 2012 . 18:32
( )
+
<a href="http://www.liveinternet.ru/users/lj_ru_ir/post219351011/">История Информационного Поиска</a><br/>Первая автоматическая информационно поисковая система была реализована в 20-х годах прошлого столетия. Продолжение... http://ru-ir.livejournal.com/126019.html... <a href="http://www.liveinternet.ru/users/lj_ru_ir/post219351011/">Читать далее...</a>
, 09 2012 . 22:20
( )
+
<a href="http://www.liveinternet.ru/users/lj_ru_ir/post216254585/">Real-world text mining using machine learning</a><br/>Дорогие коллеги!В ближайшую субботу, 21 апреля, на семинаре по автоматической обработке естественного языка выступит профессор Ян Жижка (Чехия).Ян прочтет доклад на тему "Real-world text mining using machine learning". Продолжительность доклада - 3 часа. Внимание - семинар будет проходить на АНГЛИЙСКОМ языке.Аннотация:Today, huge volumes of text data are available, especially on the Internet. Very often, the data is not structured and the text is freely written by the Internet users in natural languages. Such the data is expected to contain interesting or valuable information that can be used ... <a href="http://www.liveinternet.ru/users/lj_ru_ir/post216254585/">Читать далее...</a>
, 16 2012 . 20:35
( )
+
!
,
21 ,
().
"
Real-world text mining using machine learning ". -
3 . -
.
:
Today, huge volumes of text data are available, especially on the Internet. Very often, the data is not structured and the text is freely written by the Internet users in natural languages. Such the data is expected to contain interesting or valuable information that can be used for different goals in a lot of application areas. Because the data is too big, it is very difficult or impossible to process it "manually" within an acceptable time. Fortunately, modern informatics procedures and methods enable us to apply sophisticated methods included in artificial intelligence, especially the set of algorithms called machine learning. Machine learning methods applied to text mining are based on the inductive learning from existing examples.
In the first part, the talk deals with a brief introduction to some machine learning methods applied to text mining. The main problems are connected with the appropriate preprocessing of the data, designing the mining procedure including selection of suitable algorithms and interpreting the results.
In the second part, some interesting results obtained from the real-world data will be presented. The data represents opinions/sentiments of customers' reviews relating to services provided by hotel accommodation all over the world. The reviews are written by hundreds of thousands of customers in many languages. The focus of the described research was on revealing typical words and phrases in several languages, including English, Spanish, French, German, Japanese, Russian, Czech, and others.
:
10 .. 49, 308 .
17:00 .
: " ".
http://ru-ir.livejournal.com/125860.html
<a href="http://www.liveinternet.ru/users/lj_ru_ir/post214529046/">Преобразование структур зависимостей</a><br/>Уважаемые коллеги,В ближайшую субботу, 7 апреля, в 17:00 состоится очередной семинар по автоматической обработке естественного языка.Ангелина Иванова (University of Oslo) представит доклад на тему "Преобразование структур зависимостей".Инициативой DELPH-IN разработан синтаксически размеченный корпус LinGO Redwoods. Корпус аннотирован вручную в рамках формальной грамматики LinGO English Resource Grammar. Каждое предложение снабжено двумя видами древовидных структур: (1) синтаксическим деревом (DELPH-IN derivation tree), (2) семантическим графом зависимостей в формате Minimal Recursion Semantics... <a href="http://www.liveinternet.ru/users/lj_ru_ir/post214529046/">Читать далее...</a>
, 04 2012 . 17:03
( )
+
,
,
7 ,
17:00 .
(University of Oslo) "
".
DELPH-IN LinGO Redwoods. LinGO English Resource Grammar. : (1) (DELPH-IN derivation tree), (2) Minimal Recursion Semantics - MRS. , , - . , HPSG- , . .
(CoNLL,Stanford, EnjuPredicate - Argument Structures).
:
10 .. 49, 308 .
: " ".
http://ru-ir.livejournal.com/125529.html
<a href="http://www.liveinternet.ru/users/lj_ru_ir/post213393197/">RUSSIR и конференция молодых ученых призывают участников!</a><br/>Подробности по ссылке. http://ru-ir.livejournal.com/125377.html... <a href="http://www.liveinternet.ru/users/lj_ru_ir/post213393197/">Читать далее...</a>
, 27 2012 . 19:06
( )
+
<a href="http://www.liveinternet.ru/users/lj_ru_ir/post213153482/">инженерия гуманитарного знания: магистратура</a><br/>Кафедра информационных систем в искусстве и гуманитарных науках СПбГУ в рамках направления 230700 "Прикладная информатика" открывает прием в магистратуру по образовательной программе "Инженерия гуманитарных знаний".Срок обучения 2 года. Обучение завершается защитой магистерской диссертации.Учебный план предусматривает, в том числе, следующие курсы: "Методы и модели онтологической инженерии", "Системы понимания текста" "Модели анализа текста и их программная реализация", "Статистические методы в языковой инженерии", "Корпусные методы в языковой инженерии", "Лингвистика текста и теория речевой ... <a href="http://www.liveinternet.ru/users/lj_ru_ir/post213153482/">Читать далее...</a>
, 26 2012 . 10:15
( )
+
230700 " " " ".
2 . .
, , : " ", " " " ", " ", " ", " ", " ".
2012 . ( ) .
, :
1. 2. 3. 4. OWL- ( IntTez)
, , .
.
, 27 15.00, , 10- .., . 49 . 308
http://ru-ir.livejournal.com/125001.html
<a href="http://www.liveinternet.ru/users/lj_ru_ir/post212368714/">Анализ естественного языка в моделировании требований для CASE-технологий</a><br/>Уважаемые коллеги,В субботу, 24 марта, состоится очередной семинар по автоматической обработке естественного языка.С докладом на тему "Анализ естественного языка в моделировании требований для CASE-технологий" выступит Вадим Нуриахметов (ТулГУ).В докладе излагается подход к решению задачи построения всех понятий на формальном контексте. Данный подход основывается на применении концептуальных графов. Это позволяет для текстов на естественном языке строить конкретные контексты пониженной размерности и находить на них понятия, выявляя в тексте объекты и их атрибуты. Данный подход снижает сложност... <a href="http://www.liveinternet.ru/users/lj_ru_ir/post212368714/">Читать далее...</a>
, 22 2012 . 12:57
( )
+
<a href="http://www.liveinternet.ru/users/lj_ru_ir/post211170097/">Методы построения систем автоматического анализа текста на базе лингвистических шаблонов</a><br/>Уважаемые коллеги,В субботу, 17 марта, состоится очередной семинар по автоматической обработке естественного языка.С докладом на тему "Методы построения систем автоматического анализа текста на базе лингвистических шаблонов" выступит доцент факультета ВМиК МГУ Большакова Елена Игоревна.В докладе будет рассмотрен класс задач автоматической обработки текста (АОТ), решаемых на базе частичного синтаксического анализа (shallow approach), и применяемые для этого методы и средства. Уточняется понятие лингвистического шаблона, характеризуется разработанный формальный язык лексико-синтаксических шаблон... <a href="http://www.liveinternet.ru/users/lj_ru_ir/post211170097/">Читать далее...</a>
, 13 2012 . 20:05
( )
+
<a href="http://www.liveinternet.ru/users/lj_ru_ir/post209878503/">RuSSIR 2012: программа</a><br/>Опубликована программа Российской Летней Школы по Информационному Поиску (aka RuSSIR).В программе шесть полноценных курсов:Ingmar Weber An Introduction to Web ScienceAllan Hanbury & Mihai Lupu Domain Specific Information RetrievalMarta Ruiz Costa-jussa & Maxim Khalilov The Concept and Feasibility of Modern Statistical Machine TranslationGuillaume Obozinski Probabilistic Graphical Models for Information RetrievalChirag Shah IR in Community Question-AnsweringIsmail Sengor Altingovde & Nattiya Kanhabua Dynamics of Web: Analysis and Implications from Search PerspectiveИ один вводно-ознакомительный... <a href="http://www.liveinternet.ru/users/lj_ru_ir/post209878503/">Читать далее...</a>
, 06 2012 . 09:21
( )
+
<a href="http://www.liveinternet.ru/users/lj_ru_ir/post208923747/">Разработка и тестирование лингвистических процессоров в среде GATE</a><br/>Дорогие друзья,Рады вам сообщить, что в ближайшую субботу, 3 марта, мы открываем очередной сезон семинара по автоматической обработке естественного языка.Илья Кузнецов (Центр семантических технологий НИУ ВШЭ) и Анастасия Бонч-Осмоловская (филологический факультет НИУ ВШЭ) расскажут о разработке и тестировании лингвистических процессоров в среде GATE.В докладе будут рассмотрены возможности платформы GАТЕ, предоставляющей богатый инструментарий для работы с текстами. Речь пойдет о методах выделения объектов из текста и применимости этих методов к реальным задачам, а также о том, как оценить резу... <a href="http://www.liveinternet.ru/users/lj_ru_ir/post208923747/">Читать далее...</a>
, 28 2012 . 21:17
( )
+
<a href="http://www.liveinternet.ru/users/lj_ru_ir/post208763819/">Отчет об использовании методов машинного обучения в TREC WEB AdHoc</a><br/>Хочу выразить огромную благодарность всем тем, кто мне в прошлом году дал много полезных советов на тему learning to rank. Эти советы были пущены в дело: наша команда попыталась использовать методы машинного обучения в дорожке TREC Web AdHoc. Результаты получились довольно занимательные, но, несколько неубедительные. Почему? Уж больно в TREC и аналогичных конференциях мало запросов, чтобы получить статистически значимые результаты. Еще меньше статистически значимых результатов остается после коррекции на множественное тестирование. Это множественное тестирование заслуживает отдельных пояснений... <a href="http://www.liveinternet.ru/users/lj_ru_ir/post208763819/">Читать далее...</a>
, 27 2012 . 20:55
( )
+
, learning to rank. : TREC Web AdHoc. , , . ? TREC , .
. ( - ).
, IR () . , ,
AdHoc IR 15 . , BM25. (proximity). , , ( 10-20%). , (, ) 10% , , , (
baseline ). , , baseline , .
, PageRank, ,
: , , , , . . TREC WebAdHoc
q- SpamRank . 2009-2010, 2011 (, -, ). , Million Query Track ( ). , , , , . , TREC overfitted results. , QualityScore Microsofot Learning To Rank DataSet , - ( 30 !).
... , . : , - , , . ,
A, B . B - 50- 500- A. - !
http://ru-ir.livejournal.com/123767.html
<a href="http://www.liveinternet.ru/users/lj_ru_ir/post201743783/">Вакансии стажеров в HP Labs в Петербурге</a><br/>Добрый день! Вдруг кому-то тут будет интересно.В Петербургском отделении HP Labs (исследовательское подразделение компании Hewlett-Packard) открылись вакансии стажеров. Это уникальная возможность заниматься прикладными исследованиями в крупной западной компании. Занимаемся анализом неструктурированных данных (тексты, изображения). Релевантные направления исследований: data mining, machine learning, IR, NLP, image processing, computer vision, sentiment analysis. Позиция стажера предполагает неполную занятость (20 часов в неделю), так что остается время на учебу. Приглашаем студентов старших кур... <a href="http://www.liveinternet.ru/users/lj_ru_ir/post201743783/">Читать далее...</a>
, 17 2012 . 14:40
( )
+
!
- .
HP Labs ( Hewlett-Packard) . . (, ). : data mining, machine learning, IR, NLP, image processing, computer vision, sentiment analysis. (20 ), . . , ( ), .
http://ru-ir.livejournal.com/123420.html
<a href="http://www.liveinternet.ru/users/lj_ru_ir/post200367545/">I'm feeling lucky: почему это стоит читать</a><br/>Наконец-то я закончил читать эпический труд откровения Даг Эдвардса работника номер 59 в Гугл. Эта книга произвела просто-таки неизгладимое впечатление на меня и мою супругу. Теперь я могу дать подробные рекомендации на тему того, почему эту книгу стоит читать (а не какую-нибудь другую). http://ru-ir.livejournal.com/123369.html... <a href="http://www.liveinternet.ru/users/lj_ru_ir/post200367545/">Читать далее...</a>
, 09 2012 . 05:05
( )
+
<a href="http://www.liveinternet.ru/users/lj_ru_ir/post197016476/">Cross-domain Sentiment Analysis</a><br/>Дорогие коллеги,В ближайшую субботу, 17 декабря, в 17:00 состоится очередной семинар из цикла Автоматическая обработка естественного языка.Наталья Пономарева (Statistical Cybermetrics Research group, University of Wolverhampton) прочтет доклад на тему "Cross-domain Sentiment Analysis".Доклад посвящен проблеме автоматического анализа эмоциональной окраски текста (sentiment analysis) на примере рецензий пользователей о продуктах, взятых с сайта Amazon. Мы поговорим о методах адаптации машинных алгоритмов, обученных на корпусе рецензий об одном продукте, для классификации рецензий о другом продук... <a href="http://www.liveinternet.ru/users/lj_ru_ir/post197016476/">Читать далее...</a>
, 13 2011 . 21:10
( )
+
,
,
17 ,
17:00 .
(Statistical Cybermetrics Research group, University of Wolverhampton)
"Cross-domain Sentiment Analysis". (sentiment analysis) , Amazon. , , (cross-domain sentiment classification). cross-domain sentiment classification, : (domain similarity) (domain complexity) (sentiment classification). , (graph-based algorithms), cross-domain sentiment classification.
:
10 .. 49, 308. : " ".
http://ru-ir.livejournal.com/122923.html