Eureka Engine

1

Идентификация языка - API

Определяет язык текста. Поддерживаемые языки: русский, английский, голландский, шведский, немецкий, норвежский, датский, французский, испанский, итальянский, португальский, румынский, украинский, белорусский, татарский, сербский, болгарский, казахский, польский, чешский, хорватский, боснийский, словенский, финский, грузинский, турецкий, армянский, азербайджанский, словацкий, венгерский, эстонский, латышский, литовский, киргизский, монгольский, китайский, японский, корейский, суахили, арабский, фарси, хинди, узбекский, вьетнамский, тайский, лаосский, кхмерский, тибетский, бирманский, филиппинские (бухид, тагбанва, хануноо, байбайин, себуанский, варайский), бенгальский, гурмукхи, гуджарати, ория, тамильский, телугу, каннада, малаялам, сингальский, саураштра, иврит, сирийский (арамейский).

Параметры запроса
{ "text": "Мама мыла раму. Папа смотрел телевизор." }
Ответ
[ { "l": "RU", "n": "русский", "p": 87 } ]
Значения полей

В поле data возвращается массив объектов – параметры найденных языков. Поля объектов:

l – код языка, состоящий из двух символов

n – название языка

p – процентная вероятность (от 0 до 100)
2

Определение тональности - API

Автоматически определяет тональность текста по заданному текстовому объекту.
Принимает на вход текст на русском, английском или армянском языке, ответ в json-формате.

Параметры http запроса
{ "text": "Обсуждается вопрос по линии Роскосмоса о привлечении Китая в качестве основного партнера по проекту создания лунной научной станции", "listWordsOT" : "Китай" }
Ответ
[ { "result": [{ "ton":"neut", "pos":53, "origin":"Китая", "normal":"Китай", "tonweight":1, "len":5 }], "avgNegMsg": 0.0, "avgPosMsg": 1.0, "ver": "1.0.4.200" } ]
Значения полей

В поле result возвращается массив объектов, каждый объект содержит слово и его свойства. Поля объектов:
- ton – тональность сообщения, pos- позитивная, neg- негативная, neut - нейтральная
- pos – позиция найденного объекта тональности в тексте
- origin – оригинальная форма найденного объекта тональности в тексте
- normal – нормализованная форма найденного объекта тональности в тексте
- tonweight – сила тональности документа
- len – длина найденного объекта тональности в тексте
- avgNegMsg – общая негативная тональность сообщения
- avgPosMsg – общая позитивная тональность сообщения
- ver – версия сервиса определения тональности
3

Автоклассификация - API

Автоматически классифицирует текст. Вычисляет и выдает вероятность принадлежности текста к определенной тематике.
Принимает на вход русскоязычный текст.

Параметры запроса
{ "text": "Несколько сотен сотрудников компании Apple секретно работают над созданием электромобиля, напоминающего минивэн, сообщает The Wall Street Journal со ссылкой на собственные источники. " }
Ответ
[{ {"Classes":[ { "i":9, "n":"Наука и технологи", "p":"38.93" }, { "i":0, "n":"Авто", "p":"18.18" }, { "i":1, "n":"Экономика и бизнес", "p":"11.53" } ] }]
Значения полей

В поле Classes возвращается массив объектов, каждый объект содержит слово и его свойства. Поля объектов:
- i – идентификатор категории, к которой относится текст
- n – название категории, к которой относится текст
- p – вероятность, с которой текст принадлежит к данной категории
4

Выделение имен собственных (NER) - API

Модуль автоматического определения именованных сущностей.
Принимает на вход русскоязычные и англоязычные тексты.
Позволяет классифицировать именованные объекты в русскоязычном тексте на пять классов: физические лица, юридические лица, географические объекты, названия продуктов и брендов и именованные события. Для английского языка реализована классификация на физические лица, юридические лица и географические объекты.

Параметры запроса
{ "text": "Генеральная ассамблея ООН приняла 27 марта резолюцию о территориальной целостности Украины. Об этом сообщает Agence France-Presse." }
Ответ
[ { "i": 22, "l": 3, "ner": "ORG", "v": "ООН" }, { "i": 83, "l": 7, "ner": "GEO", "v": "Украины" }, { "i": 109, "l": 20, "ner": "ORG", "v": "Agence France-Presse" } ]
Значения полей

В поле data возвращается массив объектов – именованных сущностей. Поля объектов:
- i – позиция сущности в тексте
- l – символьная длинна сущности
- v – текст сущности
Типы сущностей:
- name – физическое лицо
- org – юридическое лицо
- geo – географический объект
- prod – название товара
- entr - событие
5

Нормализация слов - API

Возвращает базовые формы слов текста и их морфологические характеристики. Принимает на вход русскоязычный текст.

Параметры запроса
{ "text": "Мама мыла раму. " }
Ответ
[ { "o": "Мама", "n": "мама", "c": "Nominative", "m": "Singular", "g": "Feminine", "p": "Undefined", "v": "Undefined", "t": "Undefined", "r": "Undefined", "pos": "Noun" }, { "o": "мыла", "n": "мыть", "c": "Undefined", "m": "Singular", "g": "Feminine", "p": "Undefined", "v": "Active", "t": "Past", "r": "Transitive", "pos": "Verb" }, { "o": "раму", "n": "рама", "c": "Accusative", "m": "Singular", "g": "Feminine", "p": "Undefined", "v": "Undefined", "t": "Undefined", "r": "Undefined", "pos": "Noun" }, { "o": ".", "n": null, "c": "Undefined", "m": "Undefined", "g": "Undefined", "p": "Undefined", "v": "Undefined", "t": "Undefined", "r": "Undefined", "pos": "Other" } ]
Значения полей

В поле data возвращается массив объектов, каждый объект содержит слово и его свойства. Поля объектов:
- o – исходное слово
- n – нормализованная форма слова
- с – падеж (Nominative, Genitive, Dative, Accusative, Locative, Instrumental, Prepositional)
- m – число (Plural, Singular)
- g – род (Masculine , Feminine, Neuter)
- p – лицо (First, Second, Third)
- v – залог (Active, Passive)
- t – время (Future, Present, Past, FutureInThePast)
- r – переходность (Transitive, Intransitive)
- pos – часть речи (список ниже)
Список частей речи
- Other - Другое (не определено)
- Article - Артикль
- Adj - Прилагательное
- AdjPron - Местоименное прилагательное
- Adv - Наречие
- AdvPart - Деепричастие
- AdvPron - Наречное местоимение
- AuxVerb - Вспомогательный глагол
- Conj - Союз
- Inf - Инфинитив
- Intr - Междометие
- Noun - Существительное
- Num - Числительное
- Part - Причастие
- Pr - Частица
- PosPron - Притяжательное местоимение
- Pred - Предикат
- Prep - Предлог
- Pron - Местоимение
- Punct - Знак пунктуации
6

Морфоанализатор - API

Определяет часть речи, словоформы, морфологические атрибуты исходного слова.
Принимает на вход русскоязычный текст.

Параметры запроса
{ "text": "Мама мыла раму. " }
Ответ
{ "r": [{ "o":"Мама", "n":"мама", "s":"мам", "c":"Nominative", "m":"Singular", "g":"Feminine", "p":"Undefined", "v":"Undefined", "t":"Undefined", "r":"Undefined", "pos":"Noun", "si":0, "wf":["мама","мам","мамам","мамами","мамах","маме","мамой","мамою","маму","мамы"] },{ "o":"мыла", "n":"мыть", "s":null, "c":"Undefined", "m":"Singular", "g":"Feminine", "p":"Undefined", "v":"Active", "t":"Past", "r":"Transitive", "pos":"Verb", "si":5, "wf":["мыть","моем","моет","моете","моешь","мой","мойте","мою","моют","моющая","моющего","моющее","моющей","моющем","моющему","моющею","моющие","моющий","моющим","моющими","моющих","моющую","моя","мыв","мывшая","мывшего","мывшее","мывшей","мывшем","мывшему","мывшею","мывши","мывшие","мывший","мывшим","мывшими","мывших","мывшую","мыл","мыла","мыли","мыло","мыт","мыта","мытая","мыто","мытого","мытое","мытой","мытом","мытому","мытою","мытую","мыты","мытые","мытый","мытым","мытыми","мытых","мыло","мыл","мыла","мылам","мылами","мылах","мыле","мылом","мылу","мыло","мыл","мыла","мылам","мылами","мылах","мыле","мылом","мылу","мыло","мыл","мыла","мылам","мылами","мылах","мыле","мылом","мылу"] },{ "o":"раму", "n":"рама", "s":"рам", "c":"Accusative", "m":"Singular", "g":"Feminine", "p":"Undefined", "v":"Undefined", "t":"Undefined", "r":"Undefined", "pos":"Noun", "si":10, "wf":["рама","рам","рамам","рамами","рамах","раме","рамой","рамою","раму","рамы"] },{ "o":".", "n":".", "s":null, "c":"Undefined", "m":"Undefined", "g":"Undefined", "p":"Undefined", "v":"Undefined", "t":"Undefined", "r":"Undefined", "pos":"Punctuation", "si":15, "wf":null }] }
Значения полей

В поле r возвращается объект определяемого слова. Поля объекта:
- о – оригинальная форма слова в сообщении
- n – нормализованная форма слова в сообщении
- s – основа слова
- c – падеж
- m – число
- g – род
- p – лицо
- v – залог
- t – время
- r – переходность
- pos – часть речи
- si – позиция слова в тексте
- wf – список возможных словоформ

Идентификация языка - API

Определение тональности - API

Автоклассификация - API

Выделение имен собственных (NER) - API

Нормализация слов - API

Морфоанализатор - API