Category: компьютеры

РГГУ и трагедия русской компьютерной лингвистики.

РГГУ и трагедия русской компьютерной лингвистики.
Умер Илья Сегалович. Я косвенно его знал - в мире компьютерной лингвистики все друг друга знают. Если по честному, практикующих "компьютерных лингвистов" всего-то человек 100, а почему так мало... Вот об этом я напишу свои мысли.
Трагедия русской компьютерной лингвистики - это крупные корпорации типа Яндекса. Сейчас, когда в СМИ стонут какие-то странные личности (уверен, они никогда не читали Хомского, не рыдали ночами над Пешковским и уж тем более фамилии Шахматова или Щербы для них пустой звук), когда политики восхваляют умершего.. но я не буду писать о Сегаловиче - de mortuis aut bene aut nihil.
(Однако стон не повсеместный. Скажем, религиозные консерваторы уже попытались рассмотреть вопрос смерти Сегаловича под другим углом. Впрочем, сделали это коряво и не очень красиво - как свойственно иным глубоко верующим людям, уверенным на голубом глазу, что искренняя вера служит оправданием безнравственных поступков.)
Вероятно, сейчас также не следует писать, что именно Яндекс откровенно занимается шпионажем за пользователями (Яндекс - коммерческий аналог PRISM, как тут не вспомнить Сноудена!), сливая информацию всем заинтересованным людям.
Также не следует писать, что Яндекс продает рекламу всяким сомнительным политикам и иным личностям... Что "русский" Яндекс частично принадлежит американским консервативным политиканам (вроде Ромни)...
Но почему русская компьютерная лингвистика "замерзла" на одной точке своего развития? Почему программисты и лингвисты бесконечно изобретают вечный двигатель (под названием "искусственный интеллект") и ничего не делают, чтобы написать в общем-то простые программы работы с текстом?
Кому интересны подробности, посмотрите здесь http://forum.dialog-21.ru/actualthread.aspx?tid=370
Из этого диалога (к слову сказать, сей форум гордо претендует на звание "самого крупного форума по компьютерной лингвистике")
очевидно, что уважаемый С. А. Крылов, профессор РГГУ, ни бум-бум в самых простых компьютерных алгоритмах - увы, Сергей Александрович даже не подозревает, как работают морфологические анализаторы. Отсюда же видно, какие глобальные барьеры возведены для "компьютерных лингвистов" крупными корпорациями типа Яндекса и Гугля: "мозги" беззастенчиво скупают, а вся компьютерная лингвистика принудительно сводится коммерсантами к работе над потоками новостей (как выявить "знание" из газетного заголовка, чтобы встроить очередную корявую программу в rss-ленту мэйл.ру или яндекс.ру http://forum.dialog-21.ru/actualthread.aspx?tid=6548) или
же создать очередную программу "шпионажа" за виртуальными личностями - см. здесь http://koi.nsu.ru/new/website/koi/var/custom/File/Stepanov_master.pdf
Да, Яндекс и Гугль многое сделали для материальной поддержки компьютерных лингвистов - только эта помощь не бескорыстная, как пытаются сейчас "представить дело" апологеты крупных поисковых систем, в связи со смертью Сегаловича. И как мне кажется, эта помощь очень сильно затормозила развитие программистских решений: потому что корпорации "подгребли" под себя значительную часть компьютерных лингвистов, и ориентировали программы на свои нужды, на нужды поисковых систем. У них есть деньги, у них есть воля, что сказать еще?
PS Мне кажется, самая лучшая и одновременно печально-показательная разработка с участием Сегаловича - это http://www.ruscorpora.ru/
Это хорошая и удобная программа. Жаль только, что вместо открытого корпуса нам подсунули (с помощью все того же Яндекса) закрытое программное решение. А ведь давно существуют корпусы английского, французского, испанского и т.д. языков - и это в том числе унифицированные программные решения на открытом коде.
http://en.wikipedia.org/wiki/Text_corpus
Так что не будет у нас в ближайшее время русского Ворднета
http://ru.wikipedia.org/wiki/WordNet
Будет вот это "Проект Russian WordNet под патронажем ПГУПС (недоступная ссылка)"
А не будет Ворднета, будут тупые и ограниченные попытки создать "смысловой анализатор текста" по заказу поисковых систем.