Shlesha

Система использует контекстные эмбеддинги на базе трансформеров. Анализируется окружение слова — соседние термины, грамматические связи и общая тематика документа. Например, слово «лук» в кулинарном рецепте и в инструкции к арбалету будет интерпретировано по-разному. Точность разрешения неоднозначности превышает 92% на русскоязычных корпусах.

Мы используем ансамбль из нескольких архитектур: RuBERT для общего анализа, специализированную модель для юридических текстов и гибридный модуль на основе графов знаний для терминологии. Все модели дообучены на корпусе объёмом более 50 миллиардов токенов. Выбор конкретной модели зависит от задачи и домена.

Да, платформа предоставляет REST API и готовые коннекторы для WordPress, Bitrix24 и нескольких популярных ERP-систем. Интеграция через API занимает от двух до пяти рабочих дней. Для нестандартных систем доступна документация по Webhook и SDK на Python и JavaScript.

Генерация проходит три этапа: сначала модель создаёт черновик, затем лингвистический модуль проверяет фактологическую согласованность и стиль, после чего система сверяет результат с заданными правилами (глоссарий, тональность, запрещённые формулировки). Для критичных сценариев доступен режим ручной верификации с интерфейсом правок.

Платформа принимает текст в форматах TXT, DOCX, PDF (с распознаванием), HTML и Markdown. Для пакетной обработки поддерживается импорт через CSV и JSON. Максимальный размер одного документа — 50 мегабайт. Ограничение по количеству страниц в пакетном режиме зависит от тарифного плана.

Все передаваемые данные шифруются по протоколу TLS 1.3. Серверы расположены в дата-центрах на территории Казахстана. Модели обрабатывают текст без сохранения исходных документов — после завершения анализа данные удаляются из оперативной памяти. Доступ к логам ограничен инженерами платформы и не используется для обучения сторонних моделей.

Shlesha — ИИ для лингвистического анализа

Возможности платформы

Контекстный анализ

Генерация с контролем

Доменная адаптация

Извлечение сущностей

Семантический поиск

Оценка качества

Готовы внедрить ИИ-анализ текстов?

Изучите возможности API

Голоса профессионалов

Часто задаваемые вопросы