Команда Microsoft Research AI объявила, что планирует открыть исходный код оптимизированной версии модели Google BERT, созданной для работы с движком ONNX Runtime.
В настоящее время использование ONNX Runtime позволяет сократить задержки в работе BERT при реализации языкового представления для поисковой системы Bing.
Теперь разработчики смогут внедрять BERT, используя ONNX Runtime и графический процессор Nvidia V100 с задержкой всего лишь 1,7 миллисекунды, что ранее было доступно только для крупных технологических компаний.
Оптимизированная модель Google BERT, созданная Microsoft, является результатом сотрудничества между командами Azure AI и Microsoft Research AI.
Подробнее об открытом обмене нейронными сетями (ONNX) можно прочитать здесь.
Напомним, что Google объявил о запуске BERT Update, который помогает поисковой системе лучше понимать запросы на естественном языке, в октябре минувшего года. При этом Bing начал использовать подобные BERT модели ещё в апреле 2019 года.
Комментарии