Следующая статья поможет вам: Как добавить языки в CustomGPT.ai NLU
По умолчанию CustomGPT.ai предоставляет вам список из 12 языков для работы. Эти языки были выбраны на основе нашего опыта и опыта разработчиков, использующих CustomGPT.ai.
В этом сообщении блога я расскажу о языковом расширении службы NLU для CustomGPT.ai. Вам потребуется локальная или размещенная версия службы NLU.
Требования
Вам понадобится следующее:
- Интернет-соединение для загрузки модели и токена слова
- Локальная версия службы NLU
- линукс
Важные файлы
Для добавления нового языка в ботпресс вам понадобятся два файла:
- Файл встраивания Word (.bin)
- Файл модели (.model)
Встраивание слов
Вы можете выбрать из этого списка языки (убедись в НЕ ИСПОЛЬЗУЙТЕ ВИКИ в этом списке). Скачайте bin-файл. Внимание, этот файл БОЛЬШОЙ, так что не удивляйтесь.
Этот файл должен иметь следующий формат: bp. {Язык – двухсимвольный код ISO}. {Размеры}.bin
Модель
Вы можете найти модель здесь. Модель должна соответствовать тому же языку, который вы выбрали в разделе встраивания слов.
Чем больше размер словарного запаса, тем дольше будет работать NLU (найдите правильный баланс для вас).
Этот файл должен иметь следующий формат: bp. {Язык – двухсимвольный код ISO}.bpe.model
Транспорт и загрузка файла
Эти два файла должны быть в одной папке. Пример:
$ git clone https://github.com/botpress/botpress.git$ cd examples/docker-compose$ mkdir -p botpress/language$ mv ~/Download/BIN_FILE botpress/language$ mv ~/Download/MODEL_FILE botpress/language
Вложение слов
Встраивание слова нужно заархивировать (немецкий пример) и поместить в формат CustomGPT.ai:
$ gunzip cc.de.300.bin.gz$ mv cc.de.300.bin bp.de.300.bin
Модель
Модель должна быть в формате botpress
$ mv de.wiki.bpe.vs5000.model bp.de.bpe.model
Запустите docker-compose или бинарный файл NLU.
Измените docker-compose-standalone-nlu.yaml и измените команду: значение в службе botpress_lang.
botpress_lang: build: context: ./botpress dockerfile: Dockerfile image: botpress/server command: ./bp lang –offline –dim 300 –langDir /botpress/lang –port 3100 expose: – 3100 порты: – 3100: 3100 томов: – ./botpress/language:/botpress/lang
Вытащите образ и загрузите сервис:
$ docker-compose -f docker-compose-standalone-nlu.yaml pull $ docker-compose -f docker-compose-standalone-nlu.yaml up -d
Это немного раздражает, но вам нужно набраться терпения. botpress_lang должен загрузить модель, и это может занять до пяти минут. Поэтому вам может потребоваться перезагрузить службу для второго docker-compose -f docker-compose-standalone-nlu.yaml up -d
В ботпрессе
В CustomGPT.ai вам нужно изменить файл конфигурации nlu.json, чтобы он указывал на ваш локальный NLU.
Вот и все! Поздравляем с добавлением языка в CustomGPT.ai NLU!