Linguistics

Материал из ALT Linux Wiki

(Различия между версиями)

Перейти к: навигация, поиск

Версия 05:00, 20 февраля 2009

Лингвистика и обработка естественного языка (Natural language processing)

FIXME:организовать в более общие разделы, дополнить

Содержание

1 Лемматизация
2 Морфологический и синтаксический анализ
3 Лингвистическая аннотация, базы данных
4 Коллокации, анализ сочетаемости

Лемматизация

perl-Lingua-Stem — Русский, Немецкий, Францунзский, Итальянский, Датский, Шведский, Португальский FIXME:описание

Морфологический и синтаксический анализ

aot — Русский, Немецкий, Английский FIXME:описание

Лингвистическая аннотация, базы данных

emdros — база данных для аннотированного текста. Оригинальная модель представления аннотированных данных (текста), гибкий язык запросов MQL. Утилиты для импорта из популярных форматов лингвистической аннотации. Графические пользовательские программы для наполнения и запросов к БД.

Коллокации, анализ сочетаемости

perl-Text-NSP — пакет для статистического анализа N-грамм в тексте (Ted Pedersen). Не полностью корректно поддерживает unicode, поэтому есть проблемы при обработке русского текста.
perl-UCS — пакет для статистического анализа коллокаций (Stefan Evert), UCSTools. Работает с данными от perl-Text-NSP.

@@ Строка 4: / Строка 4: @@
 == Лемматизация ==
+* '''{{PkgL|perl-Lingua-Stem}}''' — Русский, Немецкий, Францунзский, Итальянский, Датский, Шведский, Португальский {{discuss|FIXME:описание}}
-* {{PkgL|perl-Lingua-Stem}} Русский, Немецкий, Францунзский, Итальянский, Датский, Шведский, Португальский {{discuss|FIXME:описание}}
 == Морфологический и синтаксический анализ ==
+* '''{{PkgL|aot}}''' — Русский, Немецкий, Английский {{discuss|FIXME:описание}}
-* {{PkgL|aot}} Русский, Немецкий, Английский {{discuss|FIXME:описание}}
 == Лингвистическая аннотация, базы данных ==
+* '''{{PkgL|emdros}}''' — база данных для аннотированного текста. Оригинальная модель представления аннотированных данных (текста), гибкий язык запросов MQL. Утилиты для импорта из популярных форматов лингвистической аннотации. Графические пользовательские программы для наполнения и запросов к БД.
-* {{PkgL|emdros}} База данных для аннотированного текста. Оригинальная модель представления аннотированных данных (текста), гибкий язык запросов MQL. Утилиты для импорта из популярных форматов лингвистической аннотации. Графические пользовательские программы для наполнения и запросов к БД.
 == Коллокации, анализ сочетаемости ==
+* '''{{PkgL|perl-Text-NSP}}''' — пакет для статистического анализа N-грамм в тексте (Ted Pedersen). Не полностью корректно поддерживает unicode, поэтому есть проблемы при обработке русского текста.
-* {{PkgL|perl-Text-NSP}} пакет для статистического анализа N-грамм в тексте (Ted Pedersen). Не полностью корректно поддерживает unicode, поэтому есть проблемы при обработке русского текста.
+* '''{{PkgL|perl-UCS}}''' — пакет для статистического анализа коллокаций (Stefan Evert), UCSTools. Работает с данными от {{PkgL|perl-Text-NSP}}.
-* {{PkgL|perl-UCS}} пакет для статистического анализа коллокаций (Stefan Evert), UCSTools. Работает с данными от {{PkgL|perl-Text-NSP}}.
 [[Категория:Пользователю]]
 [[Категория:Специализированный софт]]

Linguistics

Материал из ALT Linux Wiki

Версия 05:00, 20 февраля 2009

Содержание

Лемматизация

Морфологический и синтаксический анализ

Лингвистическая аннотация, базы данных

Коллокации, анализ сочетаемости

Просмотры

Личные инструменты

Разделы wiki

Навигация

редактирование

Поиск

Инструменты