Суперкомпьютер Minva Baidu продемонстрировал самые лучшие мировые результаты в бенчмаркинге технологий искусственного интеллекта.
Minva просканировал ImageNet – базу данных более чем 1 млн изображений – и обучил себя, как сортировать их по предопределённым наборам, составляющим около 1000 различных категорий.
5 лет назад вероятность того, что компьютеры превзойдут человека в этой задаче, казалась отдалённой. Однако компьютеры, управляемые Microsoft, Google, а теперь и Baidu, за последние несколько месяцев продемонстрировали лучшие результаты, чем люди.
Попрактиковшись, люди верно определяют все, кроме 5%, фото ImageNet. Коэффициент ошибок ПО Microsoft составляет 4,94%; Google – 4,8%; Baidu – 4,58%.
Так называемые алгоритмы машинного обучения, которые Baidu и другие компании используют для успешного прохождения этих тестов, только недавно вышли из-за стен академических лабораторий в Силиконовую долину. Однако они уже начали оказывать влияние на повседневную жизнь.
Два года назад Google использовал технологии машинного обучения, чтобы значительно улучшить систему распознавания речи в Android.
Baidu использует ещё более мощный суперкомпьютер для анализа 14 тыс. часов голосовых данных для улучшения распознавания китайской и англоязычной речи в поиске.
«Я очень взволнован тем прогрессом в видении компьютеров, который осуществило всё сообщество», — сказал Эндрю Hг (Andrew Ng), ведущий научный сотрудник Baidu. «Компьютеры могут намного лучше понимать изображения и делать многие вещи, которые были для них невозможны всего лишь год назад».
В ближайшие 18 месяцев Baidu планирует построить ещё более мощную машину, которая сможет выполнять 7 квадриллионов вычислений в секунду. Этого будет достаточно, чтобы система ранжировалась как один из 10 самых мощных суперкомпьютеров в мире, хотя она выполняет менее сложные вычисления, чем ведущие мировые суперкомпьютеры.
В то же время ImageNet-тест теряет свою позицию в качестве мирового эталона в этой области:
«Специалисты фокусируются на намного бо́льших массивах данных и более сложных задачах, включая распознавание объектов. В частности, обнаружение и локализацию объектов», — отметил Нг.
Комментарии