NLP

Свяжитесь с нами сейчас!

Если у вас есть готовый план проекта, либо его задумка, оставьте свои контактные данные. Мы с вами обязательно свяжемся и поможем в реализации идеи!






    Наши работы

    Проверка юридических документов с использованием методов НЛП

    Технологии: Python, NLP, Машинное обучение Продолжительность: 3 месяца Наш клиент создает финансовое программное обеспечение (под названием «CF Engine») для моделирования сложных финансовых продуктов (RMBS, ABS, CLO и т. д.). Основная цель проекта — расширить это программное обеспечение, используя функцию, которая позволяет пользователям просматривать соответствующие юридические документы на основе информации из модели. Разработанная модель должна проверять, соответствует ли конкретный документ одной из созданных моделей. Например, если обрабатываемый документ является закладной, тогда модель: - parses mortgage document (from PDF, Word, plain text format); - checks if document contains all required information (all parties are specified and described correctly, property is described, interest rate is specified, all information required by law is provided and so on); - if document fits the model then system extracts important information (parties, property description, interest rates and so on) and provides it as summary for user review. Система поддерживает разные форматы входных документов и разные типы документов, такие как ипотека, автокредит, коммерческий кредит и так далее. Также система поддерживает разные страны работы, т.е. разную структуру документов для каждой страны и разные языки.

    Сервис японско-русского перевода

    Технологии: Travatar, Moses, EDA, KyTea, Python Длительность: 1 год Целью проекта было создание переводчика рекламных текстов с японского на русский язык. Для этого мы выбрали статистическую модель перевода, основанную на сравнении большого массива параллельных текстов. Они были получены от службы вопросов и ответов (вопросы на русском переведенные на японский) и использовались в качестве клиентских текстов. Мы также использовали несколько статистических переводчиков, таких как Travatar и Moses. В дальнейшем был использован Travatar, так как он показал более качественный перевод, исходя из объективных метрик. Одной из ключевых проблем, с которыми мы столкнулись, было низкое качество перевода и отсутствие выравнивания на уровне предложений. Для его выравнивания был разработан статистический алгоритм, работающий с поиском ближайших высказываний на основе словаря n-грамм.

    Система управления контентом чат-бота с использованием ChatScript

    Технологии: Python, GoogleDocs API Продолжительность: 3 месяца Цель проекта — построить систему управления контентом на основе Google Spreadsheets и ChatScript. CMS спроектирована и построена таким образом, что ее можно подключить к Fieldbook и Google Sheets с помощью клиентского приложения для чат-ботов, чтобы по запросу запускать новых чат-ботов. Кроме того, правки можно вносить в Google Sheets, а затем отправлять в производство. Это решение для писателей, позволяющее создавать контент непосредственно в CMS на основе синтаксиса ChatScript. Система обрабатывает эти изображения как обучающие образцы для построения базы данных и соответствующей модели идентификации. На основе построенной модели система пытается идентифицировать автора для любой пользовательской подписи.

    Свяжитесь с нами сейчас!

    Если у вас есть готовый план проекта, либо его задумка, оставьте свои контактные данные. Мы с вами обязательно свяжемся и поможем в реализации идеи!