Linguistics

Материал из ALT Linux Wiki

(Различия между версиями)
Перейти к: навигация, поиск
(Новая: '''Лингвистика и обработка естественного языка (Natural language processing)''' {{discuss|FIXME:организовать в более общие ...)
Строка 5: Строка 5:
== Лемматизация ==
== Лемматизация ==
-
* {{pkgl|perl-Lingua-Stem}} Русский, Немецкий, Францунзский, Итальянский, Датский, Шведский, Португальский {{discuss|FIXME:описание}}
+
* {{PkgL|perl-Lingua-Stem}} Русский, Немецкий, Францунзский, Итальянский, Датский, Шведский, Португальский {{discuss|FIXME:описание}}
== Морфологический и синтаксический анализ ==
== Морфологический и синтаксический анализ ==
-
* {{pkgl|aot}} Русский, Немецкий, Английский {{discuss|FIXME:описание}}
+
* {{PkgL|aot}} Русский, Немецкий, Английский {{discuss|FIXME:описание}}
== Лингвистическая аннотация, базы данных ==
== Лингвистическая аннотация, базы данных ==
-
* {{pkgl|emdros}} База данных для аннотированного текста. Оригинальная модель представления аннотированных данных (текста), гибкий язык запросов MQL. Утилиты для импорта из популярных форматов лингвистической аннотации. Графические пользовательские программы для наполнения и запросов к БД.
+
* {{PkgL|emdros}} База данных для аннотированного текста. Оригинальная модель представления аннотированных данных (текста), гибкий язык запросов MQL. Утилиты для импорта из популярных форматов лингвистической аннотации. Графические пользовательские программы для наполнения и запросов к БД.
== Коллокации, анализ сочетаемости ==
== Коллокации, анализ сочетаемости ==
-
* {{pkgl|perl-Text-NSP}} пакет для статистического анализа N-грамм в тексте (Ted Pedersen). Не полностью корректно поддерживает unicode, поэтому есть проблемы при обработке русского текста.
+
* {{PkgL|perl-Text-NSP}} пакет для статистического анализа N-грамм в тексте (Ted Pedersen). Не полностью корректно поддерживает unicode, поэтому есть проблемы при обработке русского текста.
-
* {{pkgl|perl-UCS}} пакет для статистического анализа коллокаций (Stefan Evert), UCSTools. Работает с данными от {{pkgl|perl-Text-NSP}}.
+
* {{PkgL|perl-UCS}} пакет для статистического анализа коллокаций (Stefan Evert), UCSTools. Работает с данными от {{pkgl|perl-Text-NSP}}.
[[Категория:Пользователю]]
[[Категория:Пользователю]]
[[Категория:Специализированный софт]]
[[Категория:Специализированный софт]]

Версия 20:26, 19 февраля 2009

Лингвистика и обработка естественного языка (Natural language processing)

FIXME:организовать в более общие разделы, дополнить

Содержание

Лемматизация

  • perl-Lingua-Stem Русский, Немецкий, Францунзский, Итальянский, Датский, Шведский, Португальский FIXME:описание

Морфологический и синтаксический анализ

  • aot Русский, Немецкий, Английский FIXME:описание

Лингвистическая аннотация, базы данных

  • emdros База данных для аннотированного текста. Оригинальная модель представления аннотированных данных (текста), гибкий язык запросов MQL. Утилиты для импорта из популярных форматов лингвистической аннотации. Графические пользовательские программы для наполнения и запросов к БД.

Коллокации, анализ сочетаемости

  • perl-Text-NSP пакет для статистического анализа N-грамм в тексте (Ted Pedersen). Не полностью корректно поддерживает unicode, поэтому есть проблемы при обработке русского текста.
  • perl-UCS пакет для статистического анализа коллокаций (Stefan Evert), UCSTools. Работает с данными от Шаблон:Pkgl.
 
Личные инструменты