Впервые компьютер обошёл человека в словесно-рассуждающей части теста на IQ.
Машина была запрограммирована китайскими исследователями при помощи метода, известного как глубокое обучение, которое подразумевает преобразование данных в набор алгоритмов, понятных компьютеру.
До сих пор компьютеры довольно успешно обходили людей в двух из трёх частей стандартного теста на коэффициент интеллекта, или теста на IQ, — математических и логических вопросах, но они изо всех сил пытались освоить словесно-рассуждающую часть, которая смотрит на вещи, как аналогии и классификации. Это вопросы типа «Найдите слово, которое не согласуется с другими», или «Какое из этих слов является противоположностью остальных?».
Вот где потребовалось глубокое обучение. В прошлом программисты создали машины, которые были способны анализировать миллионы текстов, чтобы выяснить, какие слова часто связываются друг с другом, по сути, превращая слова в векторы, которые можно сравнить, сложить и вычесть.
Но этот подход имеет известный недостаток: он предполагает, что каждое слово имеет один смысл, представленный одним вектором. Но часто словесные тесты фокусируются на словах с более чем одним значением, чтобы сделать вопросы сложнее.
Исследователи из Университета науки и технологии Китая и Microsoft Research в Пекине попробовали иную тактику — они искали слова, которые часто появляются рядом в больших фрагментах текста. Используя алгоритм, они смотрели, как слова сгруппированы, и потом искали различные определения каждого слова в словаре. Это позволило им определить смысл каждого кластера.
Исследователи объясняют: «Это может быть сделано автоматически, так как словарное определение включает примеры, в которых слова используются в разных смыслах. Так, вычисляя векторные представления этих предложений и сравнивая их с векторными представлениями в каждом кластере, можно сопоставить их».
Это означает, что впервые машина способна распознавать различные значения слов.
Команда помогла компьютерам и дальше, подавая им многочисленные примеры вопросов, чтобы они могли распознать тип вопроса и сопоставить его с соответствующей стратегией ответа.
Затем они проверили компьютер против 200 участников разного возраста и уровня образования.
«К нашему удивлению, в среднем показатели человека немного ниже, чем у нашего предложенного метода, — пишет команда на сайте, где были опубликованы результаты. — Наша модель может конкурировать с участниками в степенях бакалавра и магистра».
Это большой шаг вперёд для искусственного интеллекта, который показывает, насколько мощным средством является глубокое обучение.
«С соответствующим использованием технологий глубокого обучения мы могли бы быть ещё на шаг ближе к настоящему человеческому интеллекту», — пишут авторы.