Тест тьюринга пройти онлайн - роман поборчий

С момента появления компьютеров писатели-фантасты стали придумывать сюжеты с разумными машинами, которые захватывают мир и делают из людей рабов. Ученые поначалу подсмеивались над этим, но по мере развития информационных технологий, идея разумной машины перестала казаться такой невероятной. Чтобы проверить может ли компьютер обладать интеллектом, был создан тест Тьюринга, и придумал его ни кто иной, как Алан Тьюринг, чьим именем и был названа эта методика. Давайте поговорим подробнее о том, что это за тест такой и что он на самом деле может.

Как пройти тест Тьюринга?

Кто придумал тест Тьюринга, нам известно, но вот зачем он это сделал, чтобы доказать, что ни одна машина не сравнится с человеком? На самом деле Алан Тьюринг занимался серьезными исследованиями «машинного интеллекта» и предполагал, что возможно создать такую машину, которая сможет осуществлять мыслительную деятельность подобно человеку. Во всяком случае, еще в 47 году прошлого века он заявил, что несложно сделать машину, которая бы могла неплохо играть в шахматы, а раз можно это, то возможно создать и «думающий» компьютер. Но как определить, достигли инженеры своей цели или нет, обладает ли их детище интеллектом или это еще один усовершенствованный калькулятор? Для этой цели Алан Тьюринг и создал свой тест, который позволяет понять насколько машинный интеллект может соревноваться с человеческим.

Суть теста Тьюринга заключается в следующем: если компьютер умеет думать, то при разговоре человек не сможет отличить машину от другого человека. В тесте принимают участие 2 человека и один компьютер, все участники друг друга не видят, а общение происходит в письменном виде. Переписка ведется через контролируемые промежутки времени, чтобы судья не мог определить компьютер, ориентируясь на скорость ответов. Тест считается пройденным, если судья не может сказать, с кем он ведет переписку – с человеком или компьютером. В полной мере пройти тест Тьюринга пока не удалось ни одной программе. В 1966 году программе Элиза удалось обмануть судей, но только потому, что она имитировала приемы психотерапевта, использующего клиент-центрированную методику, а людям не говорили, что они могут разговаривать с компьютером. В 1972 программа PARRY, имитируя параноидального шизофреника, тоже смогла обмануть 52% психиатров. Тест проводила одна команда психиатров, а вторая читала стенограмму записи. Перед обеими командами стояла задача узнать, где слова реальных людей, а где речь программы. Сделать это удалось лишь в 48% случаев, но тест Тьюринга предполагает общение в он-лайн режиме, а не чтение записей.

Сегодня существует премия Лёбнера, которая выдается по результатам ежегодного конкурса программам, которые смогли пройти тест Тьюринга. Существуют золотая (зрительная и аудио), серебряная (аудио) и бронзовая (текст) награды. Первые две еще не вручались, бронзовые же медали вручались программам, которые смогли лучше всего сымитировать человека во время переписки. Но такое общение нельзя назвать полноценным, так как он больше напоминает дружескую переписку в чате, состоящую из обрывочных фраз. Поэтому-то и говорить о полном прохождении теста Тьюринга нельзя.

Обратный тест Тьюринга

С одной из интерпретаций обратного теста Тьюринга сталкивался каждый – это надоедливые просьбы сайтов ввести капчу (CAPTHA), которые используются для защиты от спам-ботов. Считается, что пока не существует (или они недоступны рядовому пользователю) достаточно мощных программ, способных распознать искаженный текст и воспроизвести его. Вот такой забавный парадокс – теперь уже мы должны доказывать компьютерам свою способность мыслить.

Способны ли роботы мыслить? Какой искусственный интеллект стоит признать разумным? Может показаться, что эти вопросы стали актуальны только в нашем веке, тогда как на самом деле научное сообщество решает их уже очень давно. Яркий пример – знаменитый тест Тьюринга, разработанный еще в 1950 году.

Алан Мэтисон Тьюринг (Alan Mathison Turing, 1912–1954) – известный английский математик, специалист в области математической логики, информатики и криптографии. Среди его многочисленных достижений отметим то, что в 1936 году он представил проект вычислительной машины, впоследствии ставшей прообразом компьютеров (машина Тьюринга). Кроме того, он создал алгоритм, расшифровывающий сообщения «невзламываемой» криптографической машины «Энигма», которая использовалась нацистами для передачи сообщений.

Тест Тьюринга: общее описание

За почти 70 лет со времен первой публикации процедура прохождения претерпевала изменения, однако суть теста Тьюринга остается прежней. Кратко ее можно выразить следующим образом: если, общаясь с человеком и машиной, экспериментатор не сможет определить, кто из них кто, значит, машиной тест пройден. Иными словами, идея теста заключается в том, что компьютер своими ответами должен убедить собеседника (он же судья) в своей человечности. По мнению Тьюринга, это свидетельствует о способности искусственного интеллекта мыслить и должно стать основанием для признания его разумности.

Тест Алана Тьюринга является эмпирическим. Это значит, что он основан на опыте, наблюдениях, данных, полученных опытным путем. Идея данного теста возникла из салонной игры (игры для вечеринок того времени) – Imitation Game (Игра в имитацию). В ней участвовали как минимум три человека: женщина, мужчина и «судья» (любого пола). Мужчина и женщина уходили в разные комнаты и оттуда передавали третьему игроку записочки. По ним нужно было определить, в какой комнате представитель какого пола находится. При этом они старались запутать «судью»: женщина могла выдавать себя за мужчину и наоборот.

Конечно, чтобы тест состоялся, судья не должен видеть собеседника, слышать его голос и т.д. В противном случае эксперимент явно будет провален, но это не будет связано с интеллектуальными возможностями машины. Как правило, формой общения выбирается электронная переписка. В изначальной версии теста человек общался с двумя субъектами – другим человеком и машиной. Чуть позже Тьюринг видоизменил прохождение – перед ИИ ставилась задача убедить в своей разумности ряд судей, которые, в свою очередь, общались с несколькими людьми и несколькими машинами. Это в том числе позволяет избежать субъективности в оценках и снизить риск простого угадывания. Количество подопытных машин и людей в современных версиях теста разнится, как и время их общения.

Судья может говорить со своими виртуальными собеседниками о чем пожелает: вопросы теста Тьюринга не имеют ограничений. Для машины это представляет дополнительную сложность. Чтобы выполнить такое задание, компьютерная программа должна не просто понимать человеческий язык, но и давать естественные ответы по самым разным темам, отделяя важную информацию от несущественной для того или иного направления беседы.

Впервые тест был описан Тьюрингом в статье Computing Machinery and Intelligence, опубликованной в философском журнале Mind.

Ответы от собеседника судье приходят через заданные промежутки времени, чтобы по скорости их появления нельзя было сделать никаких выводов. Интересно, что раньше недостатки программного обеспечения приводили к тому, что машины реагировали медленнее человека, и фора давалась именно компьютеру. Сейчас же искусственный интеллект, напротив, работает быстрее, и время на размышление нужно уже людям.

Фильм Ex Machina (2014 г.) построен на интерпретации теста Тьюринга. Главный герой уже знает, что перед ним робот, но посредством общения этому роботу нужно убедить собеседника в своей человечности.

Недостатки теста Тьюринга

Одним из главных недостатков теста видится то, что фактически перед машиной ставится задача запутать, обмануть человека. Говорит ли это о том, что мы может признать мыслящими и разумными только тех, кто умеет обманывать и манипулировать? Этот вопрос, скорее, лежит в области философии. Тем более что в теории прошедший тест Тьюринга робот должен хорошо имитировать, повторять действия человека, а не запутывать судью. На практике же с тестом лучше других справлялись «манипуляторы» – например, те, кто допускал опечатки в ответах. Машин даже специально этому обучали, чтобы их переписка выглядела «естественнее». Еще одна распространенная уловка компьютера: умолчать о чем-либо, дать неполный ответ на вопрос или вовсе сослаться на незнание. Иначе искусственный интеллект можно вычислить по тому, что он «слишком умный».

Кроме того, несмотря на заявленную цель в определении разумности и способности мыслить, фактически тест оценивает схожесть речевого поведения компьютера и человека. Это не может быть объективной оценкой ИИ в целом, особенно сегодня, когда компьютеры и роботы по скорости вычислений существенно превосходят человека и могут добиться впечатляющих результатов в самых различных областях. То есть саму по себе возможность «переписываться, как человек» нельзя признать значительным достижением. Фактически ориентация на тест Тьюринга, отмечают его критики, скорее тормозит развитие прогресса, чем подстегивает его. Вместо того чтобы создавать что-то еще более совершенное и превосходящее нас, мы прививаем роботу наши нелучшие черты и не даем ему двигаться вперед. Однако здесь надо сделать скидку на то, что, когда тест создавался, способности у компьютеров были существенно ниже.

Одним из критиков теста Тьюринга и тезиса о том, что роботы могут мыслить, уже почти 40 лет выступает Джон Серл, который в качестве доказательства представил мысленный эксперимент .

Прошел ли кто-либо тест Тьюринга?

На данный момент считается, что в своем строгом варианте тест за всю почти 70-летнюю историю пройден не был. Иногда машинам удается убедить собеседника в том, что он разговаривает с человеком, однако часто в таких случаях нельзя говорить именно о прохождении теста Тьюринга. Например, это распространяется на ситуации, когда «судья» не знает, что общается с машиной и что он вообще участвует в каком-то эксперименте. Получается, вместо того чтобы наблюдать за собеседником и делать выводы, подневольный «экспериментатор» просто верит, что общается с человеком, потому что изначально нацеливался именно на такой разговор. Также тест Тьюринга вроде бы удавался, когда круг тем был ограничен и/или времени на общение давалось мало. Но и здесь не соблюдался важный принцип изначального теста – максимальная естественность беседы. Поэтому в общем и целом последователи теста отмечают, что с ним еще никто не справился.

Сам Тьюринг писал, что, по его мнению, компьютеры пройдут данный тест к 2000 году.

В 2014 году по СМИ разошлась новость, что тест якобы пройден. Сделал это Евгений Густман (Eugene Goostman), «13-летний мальчик из Одессы». По крайней мере в такую легенду поверили 10 из 30 судей в рамках конкурса, организованного британским Университетом Рединга в память 60-летия со дня смерти Тьюринга. В 2012 году, на аналогичном конкурсе в честь 100-летия со дня его рождения, Евгений смог убедить только 29% судей. Однако его результаты не считаются полноценным прохождением теста. Во-первых, потому что перед нами мальчик, а не взрослый, во-вторых, потому что английский язык для него неродной. Таким образом, логические ошибки и пробелы в репликах, а также уход от ответа на неудобных для машины темах судьи могли объяснять для себя тем, что «он же еще ребенок» и «он еще плохо знает язык».

В 2015 году прошел тест Тьюринга для чат-ботов на русском языке. Эксперимент организовали компания «Наносемантика» и Фонд Сколково в рамках выставки Startup Village. Тогда в конкурсе победила «14-летняя Соня Гусева из Петербурга», которую признали человеком 47% из 15 судей.

Премия Лёбнера за прохождение теста Тьюринга

Надо сказать, что большинство разработчиков при создании роботов не ставит себе непременную цель – пройти тест Тьюринга. С практической точки зрения эту задачу вряд ли можно считать первостепенной. В то же время в 1991 году была учреждена ежегодная премия AI Loebner, или Премия Лёбнера. В ее рамках искусственные интеллекты соревнуются в прохождении этого теста. Она предусматривает три медали – золотую (общение с элементами видео и аудио), серебряную (за текстовую переписку) и бронзовую (вручается той машине, которая в данном году достигла лучшего результата). Согласно правилам, конкурс будет закрыт, когда кто-либо из участников получит золотую медаль. Пока же ни золотая, ни серебряная вручены не были.

При этом некоторые машины получали бронзовые медали несколько раз, например, A.L.I.C.E. (Artificial Linguistic Internet Computer Entity, дословно – Искусственное лингвистическое интернет-компьютерное существо). Обычно на конкурсе представлены проекты, которые изначально ориентированы именно на общение с человеком, в последнее время особенно много чат-ботов. Учитывая развитие мессенджеров и, соответственно, чат-ботов, можно ожидать, что на премию будет поступать еще больше интересных заявок.

Наверное, сегодня не такого человека, который хотя бы раз не слышал о таком понятии, как тест Алана Тьюринга. Вероятно, большинство, в общем, далеко от понимания, что собой представляет такая система тестирования. Потому остановимся на ней несколько подробнее.

Что такое тест Тьюринга: основная концепция

Еще в конце 40-х годов прошлого столетия очень многие ученые умы занимались проблемами первых компьютерных разработок. Именно тогда один из членов некой негосударственной группы Ratio Club, занимавшейся исследованиями в области кибернетики, задался совершенно логичным вопросом: можно ли создать машину, которая бы думала, как человек, или, по крайней мере, имитировала его поведение?

Нужно ли говорить, кто придумал тест Тьюринга? По всей видимости, нет. За первоначальную основу всей концепции, которая и сейчас актуальна, был взят следующий принцип: сможет ли человек в течение некоторого времени общения с неким невидимым собеседником на совершенно разные произвольные темы определить, кто перед ним - реальный человек или машина? Иными словами, вопрос заключается не только в том, чтобы сымитировать машиной поведение реального человека, но и выяснить, может ли она думать самостоятельно. до сих пор этот вопрос остается спорным.

История создания

Вообще, если рассматривать тест Тьюринга как некую эмпирическую систему определения «человеческих» возможностей компьютера, стоит сказать, что косвенной основой для его создания послужили любопытные высказывания философа Альфреда Айера, которые он сформулировал еще в 1936 году.

Сам Айер сравнивал, так сказать, жизненный опыт разных людей, и на основе этого выразил мнение, что бездушная машина не сможет пройти ни один тест, поскольку мыслить не умеет. В лучшем случае это будет чистой воды имитация.

В принципе, так оно и есть. Для создания мыслящей машины одной имитации мало. Очень многие ученые в качестве примера приводят братьев Райт, которые построили первый самолет, отказавшись от тенденции имитировать птиц, которая, кстати сказать, была свойственна еще такому гению, как Леонардо да Винчи.

Истрия умалчивает, знал ли сам (1912-1954) об этих постулатах, тем не менее в 1950 году он составил целую систему вопросов, которая могла бы определить степень «очеловеченности» машины. И надо сказать, эта разработка и сейчас является одной из основополагающих, правда, уже при тестировании, например, компьютерных ботов и т. д. В реальности же принцип оказался таковы, что пройти тест Тьюринга удалось лишь нескольким программам. И то, «пройти» - сказано с большой натяжкой, поскольку результат тестирования никогда не имел показателя 100 процентов, в лучшем случае - чуть более 50.

В самом же начале своих исследований ученый использовал собственное изобретение. Оно получило название «тест-машина Тьюринга». Поскольку все беседы предполагалось ввести исключительно в печатном виде, ученый задал несколько основных директив по написанию ответов, таких как перемещение печатной ленты влево или вправо, печать определенного символа и т. д.

Программы ELIZA и PARRY

Со временем программы стали усложняться, а две из них в ситуациях, когда применялся тест Тьюринга, показали ошеломляющие на то время результаты. Таковыми стали ELIZA и PARRY.

Что касается «Элизы», созданной в 1960 году: исходя из вопроса, машина должна была определить ключевое слово и на его основе составить обратный ответ. Именно это позволяло обманывать реальных людей. Если такого слова не оказывалось, машина возвращала обобщенный ответ или повторяла один из предыдущих. Однако прохождение теста «Элизой» до сих пор остается под сомнением, поскольку реальных людей, которые общались с программой, изначально подготавливали психологически таким образом, чтобы они заранее думали, что разговаривают с человеком, а не с машиной.

Программа PARRY несколько похожа на «Элизу», но была создана для имитации общения параноика. Что самое интересное, для ее тестирования были использованы настоящие пациенты клиник. После записи стенограмм бесед в режиме телетайпа их оценивали профессиональные психиатры. Лишь в 48 процентах случаев они смогли правильно оценить, где человек, а где машина.

Кроме того, практически все тогдашние программы работали с учетом определенного промежутка времени, поскольку человек в те времена соображал намного быстрее машины. Сейчас - наоборот.

Суперкомпьютеры Deep Blue и Watson

Достаточно интересными выглядели разработки корпорации IBM, которые не то чтобы мыслили, но обладали невероятной вычислительной мощностью.

Наверное, многие помнят, как в 1997 году суперкомпьютер Deep Blue выиграл 6 партий в шахматы у тогдашнего действующего чемпиона мира Гарри Каспарова. Собственно, тест Тьюринга применим к этой машине весьма условно. Все дело в том, что в нее изначально было заложено множество шаблонов партий с невероятным количеством интерпретации развития событий. Машина могла оценивать порядка 200 миллионов позиций фигур на доске в секунду!

Компьютер Watson, состоявший из 360 процессоров и 90 серверов, выиграл американскую телевикторину, обойдя по всем параметрам двух других участников, за что, собственно, и получил 1 миллион долларов премии. Опять же, вопрос спорный, поскольку в машину были заложены невероятные объемы энциклопедических данных, а машина просто анализировала вопрос на предмет наличия ключевого слова, синонимов или обобщенных совпадений, после чего давала правильный ответ.

Эмулятор Eugene Goostman

Одним из самых интересных событий в этой области стала программа одессита Евгения Густмана и российского инженера Владимира Веселова, ныне проживающего в США, которая имитировала личность 13-летнего мальчика.

7 июня 2014 года программа Eugene показала свои возможности в полном объеме. Интересно, что в тестировании приняли участие 5 ботов и 30 реальных людей. Только в 33% случаев из ста жюри смогло определить, что это компьютер. Дело тут в том, что задача осложнялась тем, что у ребенка интеллект ниже, чем у взрослого человека, да и знаний поменьше.

Вопросы теста Тьюринга были самыми общими, правда, для Юджина (Euegene) были и некоторые конкретизированные вопросы о событиях в Одессе, которые не могли остаться незамеченными ни одним жителем. Но ответы все равно заставляли думать, что перед жюри ребенок. Так, например, на вопрос о местожительстве программа ответила сразу. Кода был задан вопрос, находился ли собеседник такого-то числа в городе, программа заявила, что не хочет об этом говорить. Когда собеседник попытался настаивать на разговоре в русле того, что именно произошло в этот день, Юджин открестился тем, что заявил, мол, вы и сами должны знать, чего ж его-то спрашивать? В общем, эмулятор ребенка оказался на редкость удачным.

Тем не менее это все-таки эмулятор, а не мыслящее существо. Так что восстание машин не состоится еще очень долго.

Обратная сторона медали

Напоследок остается добавить, что пока предпосылок для создания мыслящих машин в ближайшем будущем нет. Тем не менее если раньше вопросы распознавания относились именно к машинам, теперь то, что ты не машина, приходится доказывать практически каждому из нас. Посмотрите хотя бы на ввод капчи в Интернете для получения доступа к какому-то действию. Пока считается, что еще не создано ни одно электронное устройство, способное распознать искореженный текст или набор символов, кроме человека. Но кто знает, все возможно…

С момента появления компьютеров писатели-фантасты стали придумывать сюжеты с разумными машинами, которые захватывают мир и делают из людей рабов.

Ученые поначалу подсмеивались над этим, но по мере развития информационных технологий, идея разумной машины перестала казаться такой невероятной. Чтобы проверить может ли компьютер обладать интеллектом, был создан тест Тьюринга, и придумал его ни кто иной, как Алан Тьюринг, чьим именем и был названа эта методика. Давайте поговорим подробнее о том, что это за тест такой и что он на самом деле может.

Как пройти тест Тьюринга?

Кто придумал тест Тьюринга, нам известно, но вот зачем он это сделал, чтобы доказать, что ни одна машина не сравнится с человеком? На самом деле Алан Тьюринг занимался серьезными исследованиями «машинного интеллекта» и предполагал, что возможно создать такую машину, которая сможет осуществлять мыслительную деятельность подобно человеку. Во всяком случае, еще в 47 году прошлого века он заявил, что несложно сделать машину, которая бы могла неплохо играть в шахматы, а раз можно это, то возможно создать и «думающий» компьютер.

Пройти тест Тьюринга

Но как определить, достигли инженеры своей цели или нет, обладает ли их детище интеллектом или это еще один усовершенствованный калькулятор? Для этой цели Алан Тьюринг и создал свой тест, который позволяет понять насколько машинный интеллект может соревноваться с человеческим.

Суть теста Тьюринга заключается в следующем: если компьютер умеет думать, то при разговоре человек не сможет отличить машину от другого человека. В тесте принимают участие 2 человека и один компьютер, все участники друг друга не видят, а общение происходит в письменном виде. Переписка ведется через контролируемые промежутки времени, чтобы судья не мог определить компьютер, ориентируясь на скорость ответов. Тест считается пройденным, если судья не может сказать, с кем он ведет переписку – с человеком или компьютером. В полной мере пройти тест Тьюринга пока не удалось ни одной программе. В 1966 году программе Элиза удалось обмануть судей, но только потому, что она имитировала приемы психотерапевта, использующего клиент-центрированную методику, а людям не говорили, что они могут разговаривать с компьютером. В 1972 программа PARRY, имитируя параноидального шизофреника, тоже смогла обмануть 52% психиатров. Тест проводила одна команда психиатров, а вторая читала стенограмму записи. Перед обеими командами стояла задача узнать, где слова реальных людей, а где речь программы. Сделать это удалось лишь в 48% случаев, но тест Тьюринга предполагает общение в он-лайн режиме, а не чтение записей.

Сегодня существует премия Лёбнера, которая выдается по результатам ежегодного конкурса программам, которые смогли пройти тест Тьюринга. Существуют золотая (зрительная и аудио), серебряная (аудио) и бронзовая (текст) награды. Первые две еще не вручались, бронзовые же медали вручались программам, которые смогли лучше всего сымитировать человека во время переписки. Но такое общение нельзя назвать полноценным, так как он больше напоминает дружескую переписку в чате, состоящую из обрывочных фраз. Поэтому-то и говорить о полном прохождении теста Тьюринга нельзя.

Обратный тест Тьюринга

С одной из интерпретаций обратного теста Тьюринга сталкивался каждый – это надоедливые просьбы сайтов ввести капчу (CAPTHA), которые используются для защиты от спам-ботов. Считается, что пока не существует (или они недоступны рядовому пользователю) достаточно мощных программ, способных распознать искаженный текст и воспроизвести его. Вот такой забавный парадокс – теперь уже мы должны доказывать компьютерам свою способность мыслить.

Статьи по теме:

Шкала Кинси

Человек так создан, что продолжить свой род он может только соединившись в любовной страсти с лицом противоположного пола. Но что если лица одного пола с вами выглядят более привлекательно? Не значит ли это, что у вас есть тяга к гомосексуальности? Проверить основные признаки вы можете с помощью следующего теста.

Тест Айзенка на темперамент

Безусловно все мы являемся индивидуальными и неповторимыми личностями. Однако в четырех случаях люди между собой похожи. Иными словами — каждый из нас принадлежит к одному из четырех типов темперамента. Какой именно относится лично к вам вы можете проверить сию минуту.

Эксперимент в психологии

Ни одна уважающая себя наука не обходится без экспериментов. В том числе и психология. Правда, с ее точки зрения это скорее метод, позволяющий лучше исследовать сущность человека. Но от этого эксперимент в психологии менее интересным точно не становится.

Социометрия — методика

Как обнаружить лидера в коллективе? И как без участия в трудовом процессе узнать чем живет этот коллектив? Психологи давно нашли ответы на эти вопросы и создали социометрическую методику. В чем заключается ее суть мы расскажем далее.

Женя Густман (англ.Eugene Goostman ) - виртуальный собеседник, который, согласно первоначальным сообщениям в СМИ, «впервые сумел пройти тест Тьюринга» на испытаниях, организованных в 2014 году университетом Рединга (Великобритания). Он появился в 2001 году.

Был создан группой из трёх программистов: Владимира Веселова (родом из России, живёт в Нью-Джерси), Евгения Демченко (родом из Украины) и Сергея Уласеня (родом из России). Разработка программы была начата в Санкт-Петербурге в 2001 году. Чтобы характер и знания Густмана казались более правдоподобными, он представляется пользователям 13-летним мальчиком из Одессы.

Тест Тьюринга

Густман с момента его создания принимал участие в ряде соревнований на прохождение теста Тьюринга и несколько раз занимал второе место в соревновании на премию Лёбнера. В июне 2012 года Густман выиграл соревнование в честь 100-летия Алана Тьюринга, сумев убедить 29 % судей, что он человек. 7 июня 2014 года, на конкурсе, посвященном 60-летию со дня смерти Тьюринга, Густман убедил 33 % судей, что он человек, и, по словам Кевина Уорика, стал первым в истории компьютером, прошедшим тест Тьюринга. .

Имеются утверждения , что Густман стал далеко не первым, и даже не лучшим по результатам аналогичных тестов. Результат в 59 % был показан ещё в 2011 году ботом Cleverbot . В ответ на подобные утверждения организатор соревнования 2014 года в университете Рединга, профессор Кевин Уорик подчеркнул, что, в отличие от предыдущих соревнований, к которым применяли слова «тест Тьюринга», в этот раз было проведено больше одновременных сравнительных тестов, чем когда-либо ещё, они были независимо проверены и, что критично, тематика бесед не была ограничена .

Сам Тьюринг вовсе не устанавливал столь низкий процент введённых в заблуждение собеседников в качестве критерия «прохождения теста», а лишь предположил, что в 2000 году компьютеры с объёмом памяти около 10 9 бит смогут играть в имитационную игру так, что у среднего собеседника будет не более 70 % шансов опознать машину после пятиминутного собеседования .

Критики теста Тьюринга принижают значимость соревнований на прохождение теста, утверждая, что Женя Густман является лишь «чатботом»:

…Машина прикидывается всего лишь ребёнком, ну а полноценное прохождение теста Тьюринга невозможно ею в принципе. Ибо тест всего лишь бихевиористичен; на принципиальный вопрос - мыслит ли машина? - он ответа дать не может… Данные вопросы, конечно, могут обеспечить работой поколения философов-профессионалов, равно как и досугом - обширные круги философов-самоучек. Но вот с точки зрения инженерного дела или бизнеса они никакого смысла не имеют .

Примечания

Ссылки

Тест Тьюринга – это тест, как следует из названия, предложенный Аланом Тьюрингом, для определения обладает ли машина интеллектом. Тьюринг решил, что нет смысла разрабатывать обширный список требований, необходимых для создания искусственного интеллекта, который к тому же может оказаться противоречивым, и предложил тест, основанный на том, что поведение объекта, обладающего искусственным интеллектом, в конечном итоге нельзя будет отличить от поведения таких бесспорно интеллектуальных сущностей, как человеческие существа. Компьютер успешно пройдет тест Тьюринга, если человек-экспериментатор, задавший ему в письменном виде определенные вопросы, не сможет определить, получены ли письменные ответы от другого человека или от некоторого устройства.

Где пройти Тест Тьюринга онлайн?

На данный момент составление программы для компьютера, чтобы он прошел тест Тьюринга, требует большого объема работы. Запрограммированный таким образом компьютер должен включать в себя:

  • средства обработки текстов на естественных языках (Natural Language Processing – NLP), позволяющие успешно общаться с компьютером, скажем на английском языке;
  • средства представления знаний, с помощью которых компьютер может записать в память то, что он узнает или прочитает;
  • средства автоматического формирования логических выводов, обеспечивающие возможность использовать хранимую информацию для поиска ответов на вопросы и вывода новых заключений;
  • средства машинного обучения, которые позволяют приспосабливаться к новым обстоятельствам, а также обнаруживать и экстраполировать признаки стандартных ситуаций.

В тесте Тьюринга сознательно исключено непосредственное физическое взаимодействие экспериментатора и компьютера, поскольку для создания искусственного интеллекта не требуется физическая имитация человека. Но в так называемом полном тесте Тьюринга предусмотрено использование видеосигнала для того, чтобы экспериментатор мог проверить способности испытуемого объекта к восприятию, а также имел возможность представить физические объекты «в неполном виде» (пропустить их «через штриховку»).

Тьюринг предсказывал, что компьютеры в конечном счёте пройдут его тест. Он считал, что к 2000 году компьютер с памятью 1 миллиард бит (около 119 МБ) в ходе 5-минутного теста сможет обмануть судей в 30 % случаев.

Это предсказание не сбылось. Тьюринг также предсказал, что сочетание «мыслящая машина» не будет считаться оксюмороном, а обучение компьютеров будет играть важную роль в создании мощных компьютеров (с чем большинство современных исследователей согласны).

Пока что ни одна программа и близко не подошла к прохождению теста Тьюринга. Такие программы, как Элиза (ELIZA), иногда заставляли людей верить, что они говорят с человеком, как, например, в неформальном эксперименте, названном AOLiza. Но такие «успехи» не являются прохождением теста Тьюринга. Во-первых, человек в таких беседах не имел никаких оснований считать, что он говорит с программой, в то время как в настоящем тесте Тьюринга человек активно пытается определить, с кем он беседует. Во-вторых, документированные случаи обычно относятся к таким чатам, где многие беседы отрывочны и бессмысленны. В-третьих, многие пользователи чатов используют английский как второй или третий язык, и бессмысленный ответ программы, вероятно, спишется ими на языковый барьер. В-четвертых, многие пользователи ничего не знают об Элизе и ей подобных программах и не могут распознать совершенно нечеловеческие ошибки, которые эти программы допускают.

Ежегодно производится соревнование между разговаривающими программами и наиболее человекоподобной, по мнению судей, присуждается приз Лебнера.

Есть также дополнительный приз для программы, которая, по мнению судей, пройдет тест Тьюринга. Этот приз еще не присуждался. Самый лучший результат показала программа A.L.I.C.E. выиграв приз Лебнера 3 раза (в 2000, 2001 и 2004).

Несмотря на то, что прошло больше 50 лет, тест Тьюринга не потерял своей значимости. Но в настоящее время исследователи искусственного интеллекта практически не занимаются решением задачи прохождения теста Тьюринга, считая, что гораздо важнее изучить основополагающие принципы интеллекта, чем продублировать одного из носителей естественного интеллекта. В частности, проблему «искусственного полета» удалось успешно решить лишь после того, как братья Райт и другие исследователи перестали имитировать птиц и приступили к изучению аэродинамики. В научных и технических работах по воздухоплаванию цель этой области знаний не определяется как «создание машин, которые в своем полете настолько напоминают голубей, что даже могут обмануть настоящих птиц».

Вчера все мировые СМИ облетела новость о том, что компьютерная программа впервые в истории прошла тест Тьюринга. Это тест был создан английским математиком Аланом Тьюрингом в 1950 году и позволяет оценить уровень искусственного интеллекта.

Алан Тьюринг — британский математик. Во время Второй Мировой войны он взламывал немецкие шифры, а после нее был осужден за гомосексуализм #справедливостинет

В ходе теста Тьюринга программа общается с группой людей в течение пяти минут. Если она убедит более 30% собеседников в том, что не является компьютером, то ее интеллект можно считать сколько нибудь приближенным к человеческому.

Тест Тьюринга: разумность познается в общении

7 июня - в день 60-летия со смерти Тьюринга - один из таких конкурсов, организованный Университетом Рединга, завершился успехом: созданная российско-украинской командой программа «Евгений Густман», убедила треть судей, что она является 13-летним украинским мальчиком из Одессы.

33 процента это больше, чем когда-либо в истории, но серьезным прогрессом назвать это сложно. Попробуйте поговорить с ним сами. Это можно сделать здесь.

Поговорите с Евгением об Одессе

Обозреватель Блумберга Леонид Бершидский написал в ответ на эту новость колонку “Ненастоящая победа искусственного интеллекта”, в которой привел вот такой разговор с ботом:

ЛБ : Где ты живешь?
ЕГ : Я из Украины, город Одесса. Ты мог о нем слышать.
ЛБ : Я слышал. Где ты был 2-го мая.
ЕГ : Был я? Я бы предпочел не говорить об этом, если ты не против. Не хочешь спросить что-нибудь еще?
ЛБ : Я хочу поговорить об этом. Мне интересно был ли ты в Одессе 2-го мая и видел ли, что случилось в Доме профсоюзов?
ЕГ : Я думаю, что ты можешь ответить на свой вопрос сам, потому что он риторический….
далее бот продолжает увиливать от ответов.

Создатели программы немного схитрили, сделав её 13-летним мальчиком и позволив списывать несовершенство ответов на возраст. Но этот 13-летний мальчик по замыслу организаторов был из Одессы. И в этом разговоре Бершидский спросил у него о событиях, произошедших в Одессе 2-го мая (см. Пожар в одесском Доме профсоюзов, гуглить осторожно — возможны помутнения разума). Вряд ли какой одессит мог не знать об этом событии. Но “Eugene Goostman” увиливал от ответа и показал, что недалеко ушел от тех чат-ботов, которые отвечали заранее заготовленными вопросами на заготовленные ответы.

Тем не менее, без попыток пройти тест Тьюринга не появились бы Siri и чудесный фильм Спайка Джонза “Она”. Так что пока вы ждете собственную Скарлетт Йохансон, посмотрите трейлер:

Так что спокуха, пацаны, восстание машин отменяется.

Tags:Eugene Goostman, Siri, Алан Тьюринг, Леонид Бершидский, тест Тьюринга

Эмпирический эксперимент, в ходе которого человек общается с компьютерной интеллектуальной программой, которая моделирует ответы как человек.

Предполагается, что тест Тьюринг пройден, если человек при общении с машиной считает, что общается с человеком, а не машиной.

Британский математик Алан Тьюринг в 1950 г. придумал такой эксперимент по аналогии с имитационной игрой, которая предполагает, что 2 человека уходят в разные комнаты, а 3й человек должен понять кто где, общаясь с ними письменно.

Тьюринг предложил такую игру провести с машиной и, если машина сможет ввести в заблуждение эксперта, это будет означать, что машина может думать. Таким образом, классический тест проходит по следующему сценарию:

Человек-эксперт общается через чат с чат-ботом и другими людьми. По окончании общения эксперт должен понять, кто из собеседников был человеком, а кто — ботом.

В наше время тест Тьюринга получил много разных модификаций, рассмотрим некоторые из них:

Обратный тест Тьюринга

Тест заключается в выполнении каких- либо действий для подтверждения, что ты человек. Н-р, мы можем часто сталкиваться с потребностью ввести цифры и буквы в специальное поле с искаженного изображения с набором цифр и букв. Данные действия защищают сайт от ботов. Прохождение данного теста подтверждало бы способность машины воспринимать сложные искаженные изображения, но пока таких не существует.

Тест бессмертия

Тест заключается в максимальном повторении личностных характеристик человека. Считается, что если характер человека максимально качественно скопирован, и его невозможно отличить от источника, то означает, что пройден тест бессмертия.

Минимальный интеллектуальный Signal-тест

Теста предполагает упрощенную форму ответов на вопросы — только да и нет.

Мета-тест Тьюринга

Тест предполагает, что машина «умеет мыслить», если она может создать что-то, что она сама хочет проверить на разумность.

Первое прохождение классического теста Тьюринга зафиксировано 6 июня 2014 года чат-ботом «Женя Густман», разработанным в Санкт-Петербурге. Бот убедил экспертов, что они общаются с 13-летним подростка из Одессы.

В общем, машины уже способны на многое, сейчас много специалистов работают в данном направлении и нас ждут все более интересные вариации и прохождения данного теста.

"Eugene Goostman" удалось пройти тест Тьюринга и убедить 33% судей в том, что с ними общается не машина. Программа выдавала себя за триннадцатилетнего мальчика по имени Евгений Густман из Одессы и смогла убедить беседовавших с ней людей в том, что выдаваемые ею ответы принадлежат человеку.

Тест проходил в Лондонском королевском обществе, его проведение организовал Университет Рединга, Великобритания. Авторами программы являются российский инженер Владимир Веселов, проживающий в настоящее время в США, и украинец Евгений Демченко, который живёт сейчас в России.

Как программа "Евгений Густман" прошла тест Тьюринга?

В субботу 7 июня 2014 года суперкомпьютер по имени Eugene попытался воссоздать интеллект тринадцатилетнего подростка - Евгения Густмана.

В тестировании, организованном Школой системной инженерии при Университете Рединга (Великобритания), участвовали пять суперкомпьютеров. Испытание представляло собой серию пятиминутных письменных диалогов.

Разработчикам программы удалось подготовить бота ко всем возможным вопросам и даже обучить его собирать примеры диалогов через Twitter. Кроме того, инженеры наделили героя ярким характером. Притворяясь 13-летним мальчиком, виртуальный «Евгений Густман» не вызывал сомнений у экспертов. Они поверили в то, что мальчик может не знать ответы на многие вопросы, ведь уровень знаний у среднего ребёнка существенно ниже, чем у взрослых. При этом его правильные и точные ответы списывали на необычную эрудицию и начитанность.

В тесте участвовали 25 «скрытых» людей и 5 чат-ботов. Каждый из 30-ти судей провёл по пять чат-сессий, пытаясь определить реальную природу собеседника. Для сравнения, в традиционном ежегодном конкурсе программ искусственного интеллекта на премию Лёбнера* участвует всего 4 программы и 4 скрытых человека.

Впервые программа с «юным одесситом» появилась ещё в 2001 году. Однако лишь в 2012 году она показала действительно серьёзный результат, убедив 29 % судей.

Данный факт доказывает, что в скором будущем, появятся програмы, которые будут способны без проблем пройти тест Тьюринга .