EurekaAPI - промышленный REST API доступ к полному набору лингвистических сервисов EurekaEngine, с подробным описанием каждой функции. В EurekaAPI используется структурированный JSON-формат, что обеспечивает простой и удобный механизм обработки результатов лингво-модулей.

  • 1

    Идентификация языка - API

    Определяет язык текста. Поддерживаемые языки: русский, английский, голландский, шведский, немецкий, норвежский, датский, французский, испанский, итальянский, португальский, румынский, украинский, белорусский, татарский, сербский, болгарский, казахский, польский, чешский, хорватский, боснийский, словенский, финский, грузинский, турецкий, армянский, азербайджанский, словацкий, венгерский, эстонский, латышский, литовский, киргизский, монгольский, китайский, японский, корейский, суахили, арабский, фарси, хинди, узбекский, вьетнамский, тайский, лаосский, кхмерский, тибетский, бирманский, филиппинские (бухид, тагбанва, хануноо, байбайин, себуанский, варайский), бенгальский, гурмукхи, гуджарати, ория, тамильский, телугу, каннада, малаялам, сингальский, саураштра, иврит, сирийский (арамейский).

    Параметры запроса

    { "text": "Мама мыла раму. Папа смотрел телевизор." }

    Ответ

    [ { "l": "RU", "n": "русский", "p": 87 } ]

    Значения полей

    В поле data возвращается массив объектов – параметры найденных языков. Поля объектов:
    l – код языка, состоящий из двух символов
    n – название языка
    p – процентная вероятность (от 0 до 100)
  • 2

    Определение тональности - API

    Автоматически определяет тональность текста по заданному текстовому объекту.
    Принимает на вход текст на русском, английском или армянском языке, ответ в json-формате.

    Параметры http запроса

    { "text": "Обсуждается вопрос по линии Роскосмоса о привлечении Китая в качестве основного партнера по проекту создания лунной научной станции", "listWordsOT" : "Китай" }

    Ответ

    [ { "result": [{ "ton":"neut", "pos":53, "origin":"Китая", "normal":"Китай", "tonweight":1, "len":5 }], "avgNegMsg": 0.0, "avgPosMsg": 1.0, "ver": "1.0.4.200" } ]

    Значения полей

    В поле result возвращается массив объектов, каждый объект содержит слово и его свойства. Поля объектов:

    • ton – тональность сообщения, pos- позитивная, neg- негативная, neut - нейтральная
    • pos – позиция найденного объекта тональности в тексте
    • origin – оригинальная форма найденного объекта тональности в тексте
    • normal – нормализованная форма найденного объекта тональности в тексте
    • tonweight – сила тональности документа
    • len – длина найденного объекта тональности в тексте
    • avgNegMsg – общая негативная тональность сообщения
    • avgPosMsg – общая позитивная тональность сообщения
    • ver – версия сервиса определения тональности
  • 3

    Автоклассификация - API

    Автоматически классифицирует текст. Вычисляет и выдает вероятность принадлежности текста к определенной тематике.
    Принимает на вход русскоязычный текст.

    Параметры запроса

    { "text": "Несколько сотен сотрудников компании Apple секретно работают над созданием электромобиля, напоминающего минивэн, сообщает The Wall Street Journal со ссылкой на собственные источники. " }

    Ответ

    [{ {"Classes":[ { "i":9, "n":"Наука и технологи", "p":"38.93" }, { "i":0, "n":"Авто", "p":"18.18" }, { "i":1, "n":"Экономика и бизнес", "p":"11.53" } ] }]

    Значения полей

    В поле Classes возвращается массив объектов, каждый объект содержит слово и его свойства. Поля объектов:

    • i – идентификатор категории, к которой относится текст
    • n – название категории, к которой относится текст
    • p – вероятность, с которой текст принадлежит к данной категории
  • 4

    Выделение имен собственных (NER) - API

    Модуль автоматического определения именованных сущностей.
    Принимает на вход русскоязычные и англоязычные тексты.
    Позволяет классифицировать именованные объекты в русскоязычном тексте на пять классов: физические лица, юридические лица, географические объекты, названия продуктов и брендов и именованные события. Для английского языка реализована классификация на физические лица, юридические лица и географические объекты.

    Параметры запроса

    { "text": "Генеральная ассамблея ООН приняла 27 марта резолюцию о территориальной целостности Украины. Об этом сообщает Agence France-Presse." }

    Ответ

    [ { "i": 22, "l": 3, "ner": "ORG", "v": "ООН" }, { "i": 83, "l": 7, "ner": "GEO", "v": "Украины" }, { "i": 109, "l": 20, "ner": "ORG", "v": "Agence France-Presse" } ]

    Значения полей

    В поле data возвращается массив объектов – именованных сущностей. Поля объектов:

    • i – позиция сущности в тексте
    • l – символьная длинна сущности
    • v – текст сущности

    Типы сущностей:

    • name – физическое лицо
    • org – юридическое лицо
    • geo – географический объект
    • prod – название товара
    • entr - событие
  • 5

    Нормализация слов - API

    Возвращает базовые формы слов текста и их морфологические характеристики. Принимает на вход русскоязычный текст.

    Параметры запроса

    { "text": "Мама мыла раму. " }

    Ответ

    [ { "o": "Мама", "n": "мама", "c": "Nominative", "m": "Singular", "g": "Feminine", "p": "Undefined", "v": "Undefined", "t": "Undefined", "r": "Undefined", "pos": "Noun" }, { "o": "мыла", "n": "мыть", "c": "Undefined", "m": "Singular", "g": "Feminine", "p": "Undefined", "v": "Active", "t": "Past", "r": "Transitive", "pos": "Verb" }, { "o": "раму", "n": "рама", "c": "Accusative", "m": "Singular", "g": "Feminine", "p": "Undefined", "v": "Undefined", "t": "Undefined", "r": "Undefined", "pos": "Noun" }, { "o": ".", "n": null, "c": "Undefined", "m": "Undefined", "g": "Undefined", "p": "Undefined", "v": "Undefined", "t": "Undefined", "r": "Undefined", "pos": "Other" } ]

    Значения полей

    В поле data возвращается массив объектов, каждый объект содержит слово и его свойства. Поля объектов:

    • o – исходное слово
    • n – нормализованная форма слова
    • с – падеж (Nominative, Genitive, Dative, Accusative, Locative, Instrumental, Prepositional)
    • m – число (Plural, Singular)
    • g – род (Masculine , Feminine, Neuter)
    • p – лицо (First, Second, Third)
    • v – залог (Active, Passive)
    • t – время (Future, Present, Past, FutureInThePast)
    • r – переходность (Transitive, Intransitive)
    • pos – часть речи (список ниже)

    Список частей речи

    • Other - Другое (не определено)
    • Article - Артикль
    • Adj - Прилагательное
    • AdjPron - Местоименное прилагательное
    • Adv - Наречие
    • AdvPart - Деепричастие
    • AdvPron - Наречное местоимение
    • AuxVerb - Вспомогательный глагол
    • Conj - Союз
    • Inf - Инфинитив
    • Intr - Междометие
    • Noun - Существительное
    • Num - Числительное
    • Part - Причастие
    • Pr - Частица
    • PosPron - Притяжательное местоимение
    • Pred - Предикат
    • Prep - Предлог
    • Pron - Местоимение
    • Punct - Знак пунктуации
  • 6

    Морфоанализатор - API

    Определяет часть речи, словоформы, морфологические атрибуты исходного слова.
    Принимает на вход русскоязычный текст.

    Параметры запроса

    { "text": "Мама мыла раму. " }

    Ответ

    { "r": [{ "o":"Мама", "n":"мама", "s":"мам", "c":"Nominative", "m":"Singular", "g":"Feminine", "p":"Undefined", "v":"Undefined", "t":"Undefined", "r":"Undefined", "pos":"Noun", "si":0, "wf":["мама","мам","мамам","мамами","мамах","маме","мамой","мамою","маму","мамы"] },{ "o":"мыла", "n":"мыть", "s":null, "c":"Undefined", "m":"Singular", "g":"Feminine", "p":"Undefined", "v":"Active", "t":"Past", "r":"Transitive", "pos":"Verb", "si":5, "wf":["мыть","моем","моет","моете","моешь","мой","мойте","мою","моют","моющая","моющего","моющее","моющей","моющем","моющему","моющею","моющие","моющий","моющим","моющими","моющих","моющую","моя","мыв","мывшая","мывшего","мывшее","мывшей","мывшем","мывшему","мывшею","мывши","мывшие","мывший","мывшим","мывшими","мывших","мывшую","мыл","мыла","мыли","мыло","мыт","мыта","мытая","мыто","мытого","мытое","мытой","мытом","мытому","мытою","мытую","мыты","мытые","мытый","мытым","мытыми","мытых","мыло","мыл","мыла","мылам","мылами","мылах","мыле","мылом","мылу","мыло","мыл","мыла","мылам","мылами","мылах","мыле","мылом","мылу","мыло","мыл","мыла","мылам","мылами","мылах","мыле","мылом","мылу"] },{ "o":"раму", "n":"рама", "s":"рам", "c":"Accusative", "m":"Singular", "g":"Feminine", "p":"Undefined", "v":"Undefined", "t":"Undefined", "r":"Undefined", "pos":"Noun", "si":10, "wf":["рама","рам","рамам","рамами","рамах","раме","рамой","рамою","раму","рамы"] },{ "o":".", "n":".", "s":null, "c":"Undefined", "m":"Undefined", "g":"Undefined", "p":"Undefined", "v":"Undefined", "t":"Undefined", "r":"Undefined", "pos":"Punctuation", "si":15, "wf":null }] }

    Значения полей

    В поле r возвращается объект определяемого слова. Поля объекта:

    • о – оригинальная форма слова в сообщении
    • n – нормализованная форма слова в сообщении
    • s – основа слова
    • c – падеж
    • m – число
    • g – род
    • p – лицо
    • v – залог
    • t – время
    • r – переходность
    • pos – часть речи
    • si – позиция слова в тексте
    • wf – список возможных словоформ