Чего не могут ЭВМ

       

Критика искусственного разума


ОТ ИЗДАТЕЛЬСТВА

Книга американского философа Хьюберта Дрейфуса посвящена методологическим проблемам кибернетики, точнее, вопросу о возможностях и пределах машинной имитации и "усиления" человеческого разума. В научной литературе эта область исследований известна как кибернетическое моделирование познавательных процессов и разработка систем "искусственного интеллекта". Под последним понимаются системы, которые по некоторым своим характеристикам существенно приближаются к процессам функционирования чисто человеческих феноменов восприятия и мышления и их проявления в разумном поведении.

Следует подчеркнуть, что в нашей стране данная область кибернетики является предметом активных исследований. Так в Академии наук СССР имеется Научный совет по искусственному интеллекту, являющийся одновременно секцией Научного совета по комплексной проблеме "Кибернетика" при Президиуме Академии. Модельно-кибернетические исследования интенсивно ведутся в Институте кибернетики АН УССР и многих других научных центрах. В этой работе советские ученые деятельно сотрудничают со своими зарубежными коллегами: в 1975 г. в Тбилиси была проведена IV Международная объединенная конференция по искусственному интеллекту, в которой приняла участие большая группа американских кибернетиков; б апреле 1977 г. в Ленинграде состоялось Международное совещание по искусственному интеллекту, на котором специалисты из Советского Союза обсуждали проблемы кибернетического моделирования познавательных процессов совместно со своими коллегами из США и других зарубежных стран. За последние годы в нашей стране был переведен ряд книг и статей, написанных видными американскими кибернетиками, с многими из которых автор полемизирует в предлагаемой читателю монографии.

Книга написана не ученым-кибернетиком, а философом, основательно изучившим соответствующую проблематику и стремящимся осмыслить возможности и границы "искусственного разума". При этом автор уделяет особое внимание не столько возможностям данного направления исследований (о них уже

5

достаточно много написано самими специалистами в области "искусственного интеллекта"), сколько пределам его развития, которые X. Дрейфус и стремится выявить в ходе своего анализа. Появление такого рода работы в западной философско-кибернетической литературе не случайно. Оно вызвано рекламными заявлениями, которые были сделаны представителями данного направления кибернетики в США, а также тем обстоятельством, что некоторые из выдвигавшихся ими прогнозов относительно реализации тех или иных модельно-кибернетических проектов оказались неоправданными. В этой связи X. Дрейфус ставит ряд важных проблем методологического характера, заслуживающих критического анализа и осмысления с позиций диалектико-материалистической методологии. Такой анализ предпринят в статье "Что же могут вычислительные машины? (вместо послесловия) ", написанной доктором философских наук Б.В. Бирюковым, которая помещена в конце книги. Книга снабжена также примечаниями, разъясняющими, уточняющими и исправляющими отдельные ее положения.

Предлагаемая вниманию читателей работа X. Дрейфуса, основанная на богатом фактическом материале и носящая дискуссионный характер, несомненно, привлечет внимание кибернетиков, философов, психологов и специалистов других областей знания.

6


I



С тех пор как древние греки изобрели логику и геометрию, мысль о том, что всякое рассуждение может быть сведено к своего рода вычислению - так что любые дискуссии можно было бы считать улаженными раз и навсегда,- занимала умы большинства представителей точного знания на Западе. Первым, кто высказал эту мысль, был Сократ. Рассказ об "искусственном интеллекте" можно было бы начать с 450 г, до н. э., когда (как повествует Платон) Сократ обратился с вопросом к афинскому гражданину Эвтифрону, который собирался в порыве благочестия выдать властям своего отца, совершившего убийство; "Открой же мне теперь... то, что для тебя, по твоему признанию, совершенно ясно, то есть как надобно отличать благочестие от нечестия.,, что такое сама эта идея, чтобы, смотря на нее и пользуясь ею, как образцом, я мог бы согласное с нею- и в твоих поступках, и в поступках других людей - назвать святым, а несогласное - не святым"*, Сократ просит Эвтифрона открыть ему то, что специалисты по математическому обеспечению вычислительных машин назвали бы "эффективной процедурой", набором "сообщаемых нам время от времени правил, которые точно регламентируют наше поведение"**.

Платон придал этой потребности в моральной уверенности эпистемологический характер. Согласно Платону, всякое знание должно быть представлено в виде точных определений, которыми может пользоваться всякий. Если человек не может представить свое умение в виде такого рода точных правил, то есть если он не в состоянии обратить свои знания о том, как нечто делается, в знание о том, что делать, значит, он располагает не знанием, а верой, уверенностью. Согласно Платону, повара, например, руководствующиеся в своем деле вкусом и интуицией, и поэты, работа

* Платон. Соч., т. 1, Эвтифрон 5 D, 6 Е, СПб., 1863, с. 362, 365. (Звездочками отмечены подстрочные примечания автора; цифрами -примечания к русскому переводу, помещенные в конце книги. - Ред.)

** М. Минский. Вычисления и автоматы1- М., 1971,с, 135. Разумеется, Минский имеет в виду вычислительные процессы, а не действия морального характера.

7

которых зависит от вдохновения, вообще не обладают знанием: то, что они делают, не связано с пониманием и не может быть понято. Таким образом, все, что не может быть сформулировано в виде четких правил - все сферы человеческой мысли, требующие мастерства, интуиции или чувства традиции,- следует расценивать как своего рода бессмысленную одержимость.

Однако Платона еще нельзя считать кибернетиком в полном смысле слова (хотя, согласно Н. Винеру, он был первым, кто употребил этот термин2), поскольку его интересовали главным образом семантические, а не синтаксические критерии. Платон исходил из предположения, что человек понимает значение понятий, составляющих правила. В "Государстве"* Платон говорит, что понимание как таковое (то есть подразделяющаяся на части и подчиняющаяся правилам линия познания)3 зависит от разума, который предполагает диалектический анализ и в конечном счете интуитивные представления о значении основных понятий, используемых в процессе понимания. Таким образом, Платон признает, что его правила не могут быть полностью формализованы. Точно так же современный специалист по вычислительным машинам М. Минский, пытаясь реконструировать представления Платона об эффективной процедуре4, замечает: "Эта попытка дать определение вызывает критику, потому что интерпретация предусмотренных правил не должна зависеть от некоторого субъекта или посредника"**.



Аристотель, расходившийся с Платоном в этом вопросе, как и во многих других, касающихся приложения теории к практике, с удовлетворением отмечает, что для применения платоновских правил необходимо обращение к интуиции. По его мнению, совсем не просто найти формулу, с помощью которой можно было бы определить, как далеко может зайти человек и до какой степени он может заблуждаться, прежде чем в наших глазах он станет виновным5. Точно так же трудно дать определение и в случае любого объекта восприятия; такого рода вопросы о степени виновности неразрывно связаны с обстоятельствами, сопутствующими рассматриваемому конкретному случаю, где единственным нашим критерием служит восприятие***.

Для того чтобы осуществить идею Платона,требуется только одно: исключить какое бы то ни было обращение к интуиции и оценкам, носящим характер мнений. Подобно тому как Г. Галилей пришел к своему открытию чисто формального описания движения физических тел, исключив из рассмотрения все второ-

* См.: Платон. Соч. т. 3. ч. 1,M., 1971, с 89-454. **

** См.: М. Минский. Цит. соч. с. 135.

*** См.: Аристотель. Этика (к Никомаху) . В кн.: Этика Аристотеля, СПб., 1908.

8

степенные факторы и телеологические соображения, новый Галилей в науке о человеческом поведении мог бы добиться успеха, сведя все семантические соображения (обращение к значениям) к методам синтаксических (формальных) преобразований.

Убеждение в возможности такого рода тотальной формализации познания вскоре стало доминирующим в западной мысли. Теперь оно уже выражала основной моральный и интеллектуальный императив, а успехи физических наук подтверждали (как это казалось философам XVI в., а сегодня - таким мыслителям, как Минский) возможность реализации этого императива. Впервые синтаксическая концепция мышления как процесса вычисления была в явной форме сформулирована Т. Гоббсом: "Когда человек рассуждает, он лишь образует в уме итоговую сумму путем сложения частей... ибо рассуждение,., есть не что иное, как подсчитывание"*.

Оставалось только установить первичные элементы - словесные "кванты"6, которыми мог бы оперировать этот чисто синтаксический "калькулятор"- Лейбниц - изобретатель двоичной системы счисления - посвятил свою жизнь разработке необходимого для этого однозначного формального языка. Он полагал, что ему удалось найти универсальную и точную систему обозначений, некоторую алгебру, символический язык, "универсальную характеристику"7, с помощью которой каждому объекту можно приписать определяющее его "характеристическое число". Используя этот прием, всякое понятие можно представить в виде небольшого количества исходных и неопределяемых идей; все знание же может получить выражение и быть объединено в единой дедуктивной системе. На основе этих характеристических чисел-характеристик и правил их комбинирования может быть разрешен любой спор и решена любая проблема. "И если кто-нибудь усомнился бы в том, что я выдвигаю, я ответил бы ему: "Давайте вычислим, сударь!" - и мы, взяв перо и чернила, быстро вышли бы из затруднительного положения"**.

Подобно современному специалисту по математическому обеспечению ЭВМ, сообщающему о некоторой программе, которую он еще только собирается составить, Лейбниц заявляет:



"Так как в силу удивительной связи, в которой находятся все вещи, чрезвычайно трудно выделить изолированные характеристические числа, изображающие небольшое число отдельных вещей, п придумал остроумный искусственный прием, с помощью которого удастся предварительно выра-

* Гоббс. Избран, произв., т.2, М., 1964, с. 75, 76, G. W. Lеibniz. Fragments гиг Logik, Akademie-Verlag. Berlin, 1960,S.91ff8.

9

зить (darlegen) и зафиксировать определенные соотношения, после чего их уже можно подтвердить далее арифметическим вычислением"*.

И Лейбниц не скрывает огромной важности этой почти завершенной программы:

"...после того как для большинства понятий будут установлены характеристические числа, человеческий род приобретет как бы новый орган, который расширит творческие возможности духа в гораздо большей мере, чем это делают оптические инструменты по отношению к остроте зрения, и который в той же мере превзойдет микроскопы и телескопы, в какой разум превосходит зрение"**.

Обладая этим новым мощным инструментом, искусство, способы формализации которого безуспешно искал Платон, можно поднять до уровня теории, В одной из своих "финансовых заявок" (где он объясняет, каким образом можно было бы свести все мышление к манипулированию числами, если бы для этого имелось достаточно средств и времени) Лейбниц замечает:

",,.наиболее важные наблюдения и тонкости в разного рода занятиях и профессиях до сих пор не описаны. Это подтверждается на опыте, когда, пытаясь что-либо произвести, мы переходим от теории к практике. Разумеется, мы имеем возможность самым детальным образом описать результаты этой практики, ибо практика есть, по сути, не что иное, как более сложная и подробная теория"***.



Если Лейбниц только обещает, то Дж. Буль - математик и логик XIX в.- предпринимает шаги для реализации этой программы. Подобно Гоббсу, Буль считает, что рассуждение есть вычисление; его цель -"исследовать основные законы тех операций разума, посредством которых осуществляется рассуждение, выразить их на символическом языке некоторого исчисления"****.

Булева алгебра - это бинарная алгебра для представления элементарных логических функций. Если а и b- переменные, точка представляет союз "и", знак плюс - союз "или", а 1 и 0 представляют соответственно "истину" и "ложь", то правила логических переходов могут быть представлены в следующем алгебраическом виде9:

а+ а = а, а + 0 = а, а + 1 = 1,

а* а = а, а * 0 = 0, а +*1 = а.

Теперь западный человек был готов к началу вычисления.

Почти немедленно - с появлением изобретений Ч.Бэббеджа (1835)- практика стала догонять теорию10. Бэббедж задумал

* G.W. Leibniz; Selections. Ph. W i e n e r led.). New York, Siribner, 1951, p. 15,



** Ibid., p. 23.

*** Ibid.,p. 48 (курсив мой. -Х.Д.).

**** G.Boole, Collected Logical Works. Vol. II. The Laws of Thought (1854). Lasaller Illinois, 1952, p. 1.

10

проект "аналитической машины", как он ее назвал, которая - хотя она так и не была построена11 -должна была функционировать в точности так же, как и современная цифровая вычислительная машина: в ней использовались перфокарты, сочетание арифметических и логических операций, а логические решения, принимавшиеся в ходе вычислительного процесса, находились в зависимости от результатов предшествующих вычислений .

Существенная особенность машины Бэббеджа заключалась в том, что она была цифровой. Существует два основных типа вычислительных машин: аналоговые и цифровые. Аналоговые машины не вычисляют в строгом смысле слова- их функционирование заключается в измерении физических величин. Используя такие физические величины, как электрическое напряжение, длительность, угол поворота диска и т,д., пропорциональные исследуемой величине, они физически комбинируют упомянутые величины и измеряют получающийся результат. Типичный пример аналоговой вычислительной машины - логарифмическая линейка. В цифровой вычислительной машине, как это следует из используемого в ее названии слова "цифровая" - по-английски digit, что по-латыни означает "палец", - все величины представлены дискретными состояниями, например состояниями реле ("включено - выключено") телефонного диска, занимающего любую из десяти позиций, и т. д. Такая машина для получения результата считает в буквальном смысле слова.

Таким образом, в то время как аналоговые вычислительные машины оперируют непрерывными величинами, все цифровые вычислительные машины являются машинами с дискретными состояниями, или машинами дискретного действия. Говоря словами А.Тьюринга, получившего известность благодаря данному им определению природы цифровой вычислительной машины12, работа машины с дискретными состояниями

"складывается из совершающихся последовательно одна за другой резких смен их состояния- Состояния, о которых идет речь, достаточно отличны друг от друга, для того чтобы можно было пренебречь возможностью принять по ошибке одно из них за другое. Строго говоря, таких машин не существует. В действительности всякое движение непрерывно. Однако имеется много видов машин, которые удобно считать машинами с дискретными состояниями. Например, если рассматривать выключатели осветительной сети, то удобно считать, отвлекаясь от действительного положения деп, что каждый выключатель может быть либо включен, либо выключен. То, что выключатель фактически имеет также и промежуточные состояния, несущественно для наших целей, и мы можем об этом забыть"*.



Идеи Бэббеджа опередили технологию его времени, ибо в то время еще не существовало быстрого и эффективного способа

* А. Тьюринг. Может ли машина мыслить? М., 1960, с. 28.

11

представления цифр и манипулирования с ними. Для реализации дискретных состояний Бэббеджу пришлось использовать неуклюжие механические средства, такие, например, как зубчатое колесо. Необходимым технологическим решением оказались электрические переключательные схемы. Когда в 1944 г. Х.Айкен построил первую работающую цифровую вычислительную маши-ну, она представляла собой электромеханическое устройство, в которое входило около 3000 телефонных реле. Однако подобные машины работали еще медленно; и лишь следующее поколение вычислительных машин, в котором использовались электронные лампы, знаменовало собой появление современной ЭВМ, пригодной для любых вычислений.

Но что значит "для любых вычислений"? Цифровая вычислительная машина оперирует абстрактными символами, которые могут означать все что угодно, и логическими операциями, которые могут связывать все что угодно; поэтому любая цифровая вычислительная машина (в отличие от аналоговой) универсальна. Во-первых, говоря словами Тьюринга, она может моделировать любую другую цифровую вычислительную машину.

"Именно зто особое свойство цифровых вычислительных мэшин - то, что они могут имитировать любую машину с дискретными состояниями,- и имеют в виду, когда говорят, что цифровые вычислительные машины являются универсальными машинами. Из того, что имеются машины, обладающие свойством универсальности, вытекает важное следствие: чтобы выполнять различные вычислительные процедуры, нам вовсе не нужно создавать все новые и новые разнообразные машины (если отвлечься от растущих требований к быстрое вычислений). Все вычисления могут быть выполнена с помощью одной-единственной цифровой вычислительной машины, если снабжать ее надлежащей программой для каждого случая. В дальнейшем мы увидим в качестве следствия из этого результата, что все цифровые вычислительные машины в каком-то смысле эквивалентны друг другу"*.

Во-вторых (для философа это крайне важно), любой процесс, в случае если его можно формализовать таким образом, чтобы он представлял собой последовательность правил выполнения некоторых действий над дискретными элементами, может быть, по крайней мере в принципе, воспроизведен на такой машине. Следовательно, даже аналоговая вычислительная машина может быть промоделирована на машине цифровой, при условии что отношение между состояниями входа аналоговой машины и состояниями ее выхода будет описано точной математической функцией**.

* Там же, с, 31.



** В гл. 5 нам представится случай разобраться в том, как этот принцип создает у исследователей, работающих в области моделирования мыслительных процессов человека, глубокую, однако ни на чем не основанную уверенность в правильности избранного ими пути*

12

Однако эти машины так и остались бы просто арифмометрами-"переростками", если бы в них не нашли свое воплощение идеи Платона, рафинированные двумя тысячелетиями развития метафизики. Наконец появилась машина, оперирующая "квантами" данных по синтаксическим правилам. Более того, эти правила встроены в схемы самой машины. После того как в машину закладывается программа, отпадает всякая необходимость в интерпретации: никакого обращения к человеческой интуиции, никаких суждений, основанных на мнениях. Именно к этому стремились Т. Гоббс и Г.Лейбниц; недаром М. Хайдеггер справедливо назвал кибернетику кульминацией философской традиции*.

Таким образом, пока практичные люди вроде Дж. Эккерта и Дж. Мошли проектировали в Пенсильванском университете первую электронную цифровую вычислительную машину, теоретики, такие, как А. Тьюринг, пытаясь понять, какова сущность и возможности машин такого типа, оказались вовлеченными в круг вопросов, который до той поры находился в ведении философов; какова природа рассуждения как такового?

В 1950 г. Тьюринг написал программную статью "Вычислительные машины и интеллект", в которой подчеркнул, что «наш интерес к "мыслящим машинам" возник благодаря машине особого рода, обычно называемой "электронной вычислительной машиной" или "цифровой вычислительной машиной"»**. Затем он поставил вопрос: "Могут ли (такие.- Х.Д.) машины мыслить?"

Для получения ответа на него Тьюринг предложил тест, который назвал игрой в имитацию. Мы читаем:

"Эта новая форма проблемы может быть описана с помощью игры, которую мы назовем "игрой в имитацию". В этой игре участвуют три человека; мужчина (А), женщина (B) и кто-нибудь задающий вопросы (С), которым может быть лицо любого пола. Задающий вопросы отделен от двух других участников игры стенами комнаты, в которой он находится. Цель игры для задающего вопросы состоит в том, чтобы определить, кто из двух других участников игры является мужчиной (А), а кто -женщиной (В) - Он знает их под обозначениями X и У и в конце игры говорит либо: "X есть А и У есть В", либо: "X есть В, и У есть А". Ему разрешается задавать вопросы такого, например, рода:

С: "Попрошу X сообщить мне длину его (или ее) волос".



Допустим теперь, что в действительности X есть А. В таком случае А и должен давать ответ. Для А цель игры состоит в том, чтобы побудить С прийти к неверному заключению. Поэтому его ответ может быть, например, таким:

* М. Неidеgger. La fin de la philosophie et la tache de la pensee,-ln: Kierkegaard vivant, Paris, 1966, p. 178-17913: "В нашу эпоху философия пришла к своему завершению. Она нашла свое место в научном взгляде на мир.,. Фундаментальной особенностью научного детерминизма является его кибернетичность",

** А.Тьюринг. Цит, соч., с. 22-23.

13

"Мои волосы коротко острижены, а самые длинные пряди имеют около девяти дюймов в длину".

Чтобы задающий вопросы не мог определить по голосу, кто из двух других участников игры мужчина, а кто - женщина, ответы на вопросы следовало бы давать в письменном виде или, еще лучше, печатать на машинке. Идеальным случаем было бы телеграфное сообщение между комнатами, где находятся участники игры. Если же этого сделать нельзя, то ответы и вопросы может передавать какой-нибудь посредник. Цель игры для третьего игрока - женщины (В) - состоит в том, чтобы помочь задающему вопросы. Для нее, вероятно, лучшая стратегия - давать правдивые ответы. Она также может делать такие замечания, как: "Женщина - я, не слушайте его!" - но этим она ничего не достигнет, так как мужчина тоже может делать подобные замечания.

Поставим теперь вопрос: "Что произойдет, если в этой игре вместо А будет участвовать машина?" Будет ли в этом случае задающий вопросы ошибаться столь же часто, как и в игре, где участниками являются только люди? Эти вопросы и заменят наш первоначальный вопрос: "Могут ли машины мыслить?"*

Этот тест получил известность как тест Тьюринга. Вероятно, философу простое сходство в поведении машины и поведении человека покажется недостаточным основанием для признания за машиной свойства разумности**, но в качестве цели работы для тех, кто действительно пытается построить думающую машину, а также в качестве критерия, которым можно было бы пользоваться при критической оценке этих попыток, тест Тьюринга подходил как нельзя лучше.



Конечно, ни одна из существовавших тогда машин не могла быть немедленно использована в качестве партнера в игре Тьюринга. Цифровые вычислительные машины, несмотря на их быстродействие, точность и универсальность, все еще оставались ничем иным, как устройствами для переработки символов произвольного вида. Дело, однако, явно склонялось в пользу лейбницевской позиции. Пришло время для создания соответствующего символизма и детальных предписаний, с помощью которых правила ведения рассуждений можно было бы включить в программу для вычислительной машины. Осознав эту задачу, Тьюринг и предложил критерий проверки эффективности такой программы. Однако его статья заканчивается лишь очень общими соображениями по поводу имеющихся перспектив:

"Мы можем надеяться, что машины в конце концов будут успешно соперничать с людьми во всех чисто интеллектуальных областях. Но какие из этих областей наиболее пригодны для того, чтобы начать именно с них? Решение даже этого вопроса наталкивается на затруднении. Многие считают, что начать лучше всего с какой-нибудь очень абстрактной деятельности, например с игры в шахматы. Другие предлагают снабдить машину хорошими органами чувств, а затем научить ее понимать и говорить по-англий-

* Там же, с. 19-20,

** См., например, критические статьи К. Гундерсома и М.Скрайвена в кн.: A. R. Anderson. Minds and Machines. N.Y., Prlntice-Hah, 1964.

14

ски. В этом случае машину можно будет обучать, как ребенка: указывать на предметы и называть их и т. д. В чем состоит правильный ответ на этот вопрос, я не знаю, но думаю, что следует испытать оба подхода"*

Методов нахождения правил, существование которых предполагали мыслители от Платона до Тьюринга - методов превращения любой практической деятельности, будь то игра в шахматы или обучение языку, в набор указаний-команд, который Лейбниц называл теорией,- еще не было. Но немедленно, как будто по подсказке Тьюринга, начались работы по программированию игры в шахматы и машинной обработке информации, записанной на естественном языке. В том же году, когда была опубликована статья Тьюринга, появилась статья создателя теории информации К. Шеннона о машинах, играющих в шахматы, в которой обсуждались возможные подходы к программированию игры в шахматы на цифровой вычислительной машине.

"Исследование одного направления развития игры на 40 кодов вперед настолько же плохо, как и исследование вариантов только на два хода. Подходящим компромиссом было бы исследование только важнейших возможных вариантов, таких, как форсированные варианты взятия фигур и основные угрозы, и продолжение их исследования настолько далеко, чтобы проверить каждый такой вариант до полной ясности. Вполне возможно установить некоторые грубые критерии для выбора важнейших вариантов, конечно, не так эффективно, как это делает шахматист, но достаточно для того, чтобы ощутимо уменьшить число вариантов и, следовательно, позволить рассматривать достаточно глубоко выбранные варианты"**.



К. Шеннон не составил шахматной программы, но он выразил уверенность в том, что "по описанной выше программе машина будет играть довольно сильно и по скорости сравнимо с человеком"***.

В 1955 г. А. Ньюэлл произвел серьезный обзор проблем, возникающих при программировании игры в шахматы, включив в него собственные соображения по поводу того, как к этим проблемам можно было бы подойти. Он писал: "Эти (предлагаемые им.- Х.Д.) механизмы настолько сложны, что невозможно сказать заранее, будут ли они работать"****. Однако уже в следующем году мы стали свидетелями потрясающего успеха. Группа исследователей из Лос-Аламоса составила программу, которая позволила машине играть в шахматы на уменьшенной

* А. Тьюринг. Цит. соч., с. 57.

** К. Ш е н н о н. Машина для игры в шахматы.- В кн.: К.Шеннон. Работы по теории информации и кибернетике1. М-, 1963, с. 187. ***Там же, с. 188.

**** А. Newell. The Chess Machine.- In: The Modeling of Mind, К. М. Say-re and FJ. Crosson (eds.). South Bend, tnd., Notre Dame University Press, 1963, p. 89.

15

доске - хотя и слабо, но с полным соблюдением шахматных правил. Анализируя эту работу, А.Ньюэлл, Дж.Шоу и Г.Саймон писали: "машина с очень несложной программой способна по крайней мере вступить на шахматное поприще: она может обыграть начинающего игрока"*- К 1957 г. А. Бернштейн уже располагал программой для IBM-7G4, сыгравшей две "сносные любительские партии"**.

Тем временем А.Эттингер работал над реализацией второго из предложенных Тьюрингом подходов. Уже в 1952 г, он реализовал на машине программу, моделирующую простой условный рефлекс-способность усиления или ослаблении определенной реакции в зависимости от положительного или отрицательного подкрепления. Затем А.Эттингер занялся проблемой автоматического перевода и составил программу для машинной реализации русско-английского словаря. Казалось, что дальнейшие исследования в этом направлении приведут к созданию такой машины, которую можно научить устанавливать связи между словами и объектами.



Однако ни тот, ни другой подход не привели ни к чему, хотя бы отдаленно напоминающему общую теорию разумного поведения. Отсутствовали правила, в соответствии с которыми любой вид интеллектуальной деятельности можно было бы представить в виде набора инструкций (команд, указаний). В это время Г.Саймон и А.Ньюэлл, анализируя процесс решения студентами логических задач, обратили внимание на то, что их испытуемые зачастую пользуются такими правилами или "прямолинейными" приемами, которые, не будучи универсально применимыми, во многих случаях приводят к успеху, хотя случается и так, что они не позволяют решить задачу. Примером такого чисто эмпирического приема может служить следующее правило: всегда старайся заменить длинное выражение более коротким. А.Ньюэлл и Г.Саймон решили попытаться разработать модель такого практического интеллекта. Получающиеся при этом программы были названы "эвристическими" этим подчеркивалось их отличие от так называемых алгоритмических программ, которые хотя и гарантируют решение соответствующих задач (используя метод исчерпывающего поиска), однако слишком громоздки для практической реализации.

Понятие практически применимого правила дало возможность расширить поле деятельности исследователей, занятых поисками путей программирования на вычислительных машинах таких

* А. Ньюэлл, Дж. Шоу, Г.Саймон. Программа для игры в шахматы и проблема сложности. -- В кн.: Вычислительные машины и мышление, под ред. Э.Фейгенбаума и Дж. Фепьдмана^. М., 1967, с.45.

** Тамже, с. 45.

16

форм поведения, которые имеют место при решении задач общего характера. Волнение, вызванное появлением этой новой идеи, в некоторой степени отразилось на первом параграфе ставшей классической статьи А.Ньюэлла, Дж.Шоу и Г.Саймона «Эмпирические исследования машины "Логик-теоретик"; пример изучения эвристики»:

"Эта работа касается изучения процесса решения задач и является частью программы исследования сложных систем обработки информации. Мы разработали схему дни нахождения доказательства теорем в элементар­ной символической логике. Составив по этой схеме программу для вычислительной машины, мы с ее помощью получили эмпирические данные, касающиеся процесса решения задач в элементарной логике- Мы назвали эту программу «машина Логик-теоретик» (ЛТ). Она была разработана для того, чтобы изучить возможность решения таких трудных задач, как доказательство математических теорем, выявление научных законов в совокупности опытных данных, игра в шахматы или понимание смысла английской прозы.

Цель настоящего исследования -разобраться в тех сложных процессах ("эвристиках"), которые участвуют в решении задач. Поэтому мы не интересуемся методами, обеспечивающими решения задач, но требующими очень большого объема вычислений, а стремимся понять, каким образом, например, математик в состоянии доказать теорему, даже если он вначале не знает, как ему это сделать, и сможет ли он вообще ее доказать" .



Однако вскоре А.Ньюэлл и Г.Саймон осознали, что и этот подход не может считаться достаточно общим. В следующем, 1957 г. они поставили перед собой задачу выделить используемые в "Логике-теоретике" эвристики и применить их к другим задачам того же рода. В результате возникла программа, получмвшая название "Общий решатель задач"-по-английски "General Problem Solving (сокращенное название - GPS). Мотивы, побудившие ее авторов заняться "Общим решателем задач", и направленность всей работы в своем первом серьезном отчете об этом начинании Ньюэлл, Шоу и Саймон объясняют следующим образом:

"Данная статья... является частью работы, посвященной изучению чрезвычайно сложных процессов, протекающих при разумном, адаптивном и творческом поведении .,

Решению задач может способствовать использование информации само­го различного рода; информация может подсказать порядок, в котором следует проверять возможные решения; послужить основанием для того, чтобы исключить из рассмотрения целый класс решений, считавшихся ранее допустимыми; она может оказаться простым тестом для различения правдоподобных и маловероятных вариантов и т. д. Всякая информации такого рода есть эвристика, то есть то, что способствует открытию. Эвристики в редких случаях могут служить безошибочным руководством... Они часто "срабатывают", но их результаты варьируют от

А. Ньюэлл, Дж. Шоу, Г Саймон. Эмпирические исследования машины "Логик-теоретик"; пример изучения эвристики. - В кн.: Вычислительные машины и мышление, 113.

17

задачи к задаче, и успешность их применения нельзя гарантировать"*.

Для того чтобы передать смысл тех общих эвристик, которые Ньюэлл и Саймон используют в своей программе, они приводят пример повседневного разумного поведении:

"Я хочу отправить своего сына в ясли. Что мешает достичь соответствия между тем, что есть, и тем, к чему я стремлюсь? Расстояние. Что может устранить это несоответствие? Использование автомашины. Но мой автомобиль не работает. Что нужно, чтобы он заработал? Новый аккумулятор. А где его достать? В авторемонтной мастерской. Итак, мне нужно обратиться в авторемонтную мастерскую. Но в мастерской не знают о том, что мне нужен аккумулятор. В чем затруднение? В связи. Как установить связь? Для этого существует телефон... И так далее.



Такого рода анализ - классификация объектов с точки зрения функций, которые они выполняют, и переход от поставленных целей к необходимым для их выполнения функциям и средствам их реализации и обратно - составляет основу системы эвристик GPS.

Точнее, такая эвристическая система анализа в терминах "средств и целей" предполагает следующее:

1.Если дан объект, отличный от цели - желаемого объекта,- то следует стремиться к тому, чтобы установить различия между наличным объектом и целью.

2.Операторы воздействуют на одни признаки операндов10, оставляя другие неизменными. Следовательно, операторы можно охарактеризовать, указав на изменений, которые они производят; применяя соответствующие операторы к имеющимся объектам, можно устранять различия между ними и целевыми объектами.

3. Одни различия поддаются воздействию операторов с большим трудом, чем другие. Поэтому следует стремиться к элиминации "трудных" различий, пусть даже ценой введений новых различий, но меньшей трудности. Этот процесс можно продолжать до тех пор, пока не будет достигнут прогресс в элиминации более "трудных" различий"**.

Когда выяснилось, что цифровые машины могут решать задачи такого, например, рода, как задача о людоедах и миссионерах (каким образом переправить через реку трех людоедов и трех миссионеров, и при этом так, чтобы ни один миссионер не был съеден?) 17, возникло ощущение, что наконец-то мечта философов нашла необходимые для своей реализации технические средства и что в универсальную быстродействующую ЭВМ удалось ввести правила, превращающие рассуждение в вычисление, Г.Саймон и А.Ньюэлл почувствовали важность момента и торжественно провозгласили наступление эры разумных машин:

"Мы начинаем понимать, как использовать ЭВМ для решения задач, по отношению к которым мы не располагаем регулярно применимыми и эффективными алгоритмами. И теперь, по крайней мере в некоторой ограниченной области, мы умеем не только программировать

* A. Newell, J. C.Shaw and H. A. Simоn. Report on a General Problem-Solving Program, -In: Proc. int. Conf. on Information Processing, Paris, UNESCO, 1960, p. 257. ** Ibid., p. 259.



18

ЭВМ таким образом, чтобы она успешно выполняла действия, ведущие к решению задачи, но и закладывать в нее способность научения этому.

Короче говоря, теперь в нашем распоряжении имеются элементы теории эвристического (в отличие от алгоритмического) решения задач. Мы можем использовать эту теорию как для того, чтобы понять, как организованы эвристические процессы у человека, так и для того, чтобы моделировать эти процессы на цифровой машине. Интуицию, инсайт и обучение нельзя более считать исключительной прерогативой человека; ими располагает любая достаточно крупная быстродействующая ЭВМ, запрограммированная соответствующим образом"*.

Эта область исследований, в которой цифровые вычислительные машины используются для моделирования разумного поведения, вскоре получила название "искусственного интеллекта". Не следует, однако, думать, что она действительно соответствует этому названию. Вне всякого сомнения, искусственная нервная система, в достаточной степени близкая к человеческой, которая связана с органами чувств и реализована в некотором теле, конечно, будет обладать разумом. Однако термин "искусственный" не означает, что исследователи искусственного интеллекта пытаются построить искусственного человека. На современном уровне развития физики, химии и нейрофизиологии это недостижимо. Саймон и другие пионеры "искусственного интеллекта" предлагают создать нечто более ограниченное: эвристическую программу, дающую возможность цифровой машине, перерабатывающей информацию, проявлять разумность.

Термин "интеллект" тоже может привести к недоразумениям. Проектируя робота, никто не ожидает от него, что он будет воспроизводить любое поведение, которое считается разумным для человека. Роботу не придется, например, выбирать себе хорошую жену или переходить улицу на оживленном перекрестке. Он должен конкурировать с человеком только в более объективных и отвлеченных сферах человеческого поведения - с тем чтобы быть в состоянии одержать верх в игре Тьюринга.

Но именно эта ограниченность цели, поставленной исследователями, работающими в области "искусственного интеллекта", придает такое большое значение их работе. Эти "последние метафизики" делают ставку только на способность человека к формализации своего поведения; в случае выигрыша они смогут, пренебрегая мозгом и телом, постичь самую суть рационального.

Вычислительные машины уже привели к научно-технической революции, сравнимой по значению с промышленной революцией. Если Саймон прав, говоря о неизбежности "искусственного интеллекта", то ЭВМ подводят нас к грани свершения еще более значительной, концептуальной революции - к изменению наших

* H.A.Simon, A.Newell Heuristic Problem Solving: The Next Advance in Operations Research.- Operations Research, vol. 6, 1958, January-February, p. 6.



19

представлений о человеке. Важность этой революции ощущается всеми, однако мы настолько близки к соответствующим событиям, что порой бывает трудно четко представить себе их смысл. Во всяком случае, ясно следующее. Аристотель назвал человека разумным животным, и с тех пор считалось, что разум неразрывно связан с сущностью человека. Если мы находимся на пороге создания искусственного интеллекта, то в ближайшее время мы станем свидетелями триумфа весьма ограниченного представления о разуме. Действительно, если разум может быть "заложен" в вычислительную машину, то это подтвердит такое понимание природы человека, к которому в течение двух тысяч лет на ощупь шли западные мыслители и которое лишь сегодня получило средства для выражения и реализации. Воплощение этой интуитивной идеи коренным образом изменит наши представления о самих себе. Если же создание "искусственного интеллекта" окажется невозможным, то нам придется найти ту границу, которая отделяет человеческий разум от искусственного, что также радикально изменит наше понимание самих себя. Таким образом, наступил тот момент, когда мы должны либо окончательно признать, что имеющее за собой глубочайшую традицию интуитивное прозрение оказалось верным, либо отказаться от тех представлений, которые в течение двух тысячелетий считались проникновением в природу человека.

Хотя сейчас, по-видимому, еще не наступило время решения этого вопроса, мы все-таки обязаны попытаться определить масштабы и пределы такого рода разума, который полностью вступил в свои права с тех пор, как "аналитическая машина" была доведена до совершенства. Мы должны попытаться понять, в какой степени осуществим "искусственный интеллект", а если возможности машинного моделирования разумного поведения ограниченны, мы должны найти эти границы, определить, где они проходят. Все, что мы узнаем о границах разумного в применении к вычислительным машинам, будет добавлением к нашему представлению о характере и объеме человеческого интеллекта. Для этого нам понадобится ни больше ни меньше, как критика "искусственного разума".

II



Потребность в критике "искусственного разума" есть лишь частное проявление общей потребности в критическом отношении к наукам о поведении. Н.Хомский однажды заметил, что в этих науках "всегда наблюдалась вполне естественная, но достойная сожаления тенденция к "экстраполяции": полученный в результате тщательной экспериментальной работы и точной обработки

20

данных минимум знаний экстраполировался на вопросы, которые имеют гораздо более широкое значение и наполнены огромным социальным содержанием". Его вывод, относящийся к 1968 г., состоит е следующем:

«[ Специалисты ] несут на себе ответственность за тог чтобы были ясны действительные пределы их знания и тех результатов, которые получены ими на сегодняшний день, а внимательный анализ этих пределов продемонстрирует, по моему мнению, что практически в каждой области социальных и поведенческих наук достигнутые на сегодня результаты не оправдывают такую "экстраполяцию"»*.

На первый взгляд кажется, будто искусственный интеллект является счастливым исключением из этого прискорбного правила. Каждый день мы читаем о том, как цифровые вычислительные машины играют в шахматы, переводят тексты, распознают образы и скоро вообще смогут делать всю нашу работу. В самом деле, это начинает походить на детскую забаву. В буквальном см: юле этого слова! В издании Североамериканского газетного объединения, вышедшем в декабре 1968 г., была помещена статья, озаглавленная "Компьютер для детишек", в которой говорится:



"Западногерманское издательство "Космос".-, предложило новую идею подарка... Это самый настоящий (хотя и маленький) компьютер стоимостью не более 20 долларов. Работает на батарейках и внешне напоминает портативную пишущую машинку. Однако, как и в любую большую ЭВМ, в это устройство можно вводить программы для перевода с иностранных языков, диагностики заболеваний и даже для получений прогноза погоды".

Из статьи под названием "Будьте знакомы: Шейки -первый электронный человек", появившейся 20 ноября 1970 г, в журнале "Life", ошарашенный читатель узнает о существовании ЭВМ, «"смонтированной из пяти главных электронных систем, в значительной степени соответствующих основным способностям человека: восприятию, разуму, речи, памяти [и] "самосознанию"» . Судя по статье, эта ЭВМ "видит", "понимает", "учится" и вообще "доказала, что машины могут мыслить". Цитируются также высказывания некоторых известных ученых - специалистов по вычислительным машинам, которые предсказывают, что по прошествии трех-пятнадцати лет "будет создана машина, общий интеллект которой будет на уровне среднего человека, а еще через несколько месяцев он окажется на уровне гения,..".

Хотя до создания совершенного робота пройдет еще несколько лет, все, кто интересуется, как будет выглядеть мир на рубеже двух столетий, могут посмотреть фильм "2001 год: космическая Одиссея", в котором показан робот по имени ХЭЛ, невозмутимый, рассудительный, знающий и умеющий чуть ли не все на свете. И этот фильм нельзя считать просто плодом научной фантазии: "Космическая Одиссея" снималась после тщательной

* Н. Хомский. Язык и мышление19 М., 1972, с. 10-11.

21

документальной проверки. Постановщик фильма С.Кубрик консультировался с самыми видными специалистами по вычислительной математике и технике, стремясь избежать ошибок и не включать в фильм совсем уж маловероятные вещи. Сам Тьюринг в 1950 г, выразил уверенность в том, что "к концу нашего века употребление слов и мнения, разделяемые большинством образованных людей, изменятся настолько, что можно будет говорить о мыслящих машинах, не боясь, что тебя поймут неправильно"*. Технический консультант этого фильма профессор Массачусетского технологического института М.Минский, работавший в своей лаборатории над одним из первых прототипов ХЭЛа, заверил Кубрика, что если Тьюринг и ошибается, то только в сторону излишнего пессимизма.

Тот факт, что С. Кубрик правильно истолковал слова М. Минского, очевиден из редакционной статьи последнего в "Science Journal", которая весьма напоминает сценарий к фильму "2001 год":

"Сначала машины выполняли самые простые действия. Но скоро их поведение станет фантастически изящным. Если раньше глаза ЭВМ могли нащупать лишь дырочки на перфокартах, то сейчас они распознают контуры на ровном фоне. Скоро они станут соперничать с человеком в анализе окружающей его обстановки. Было время, когда машины просто склады-вали столбики цифр. Сейчас они могут участвовать в играх (типа шахмат), понимают простой разговор, учитывают множество факторов при принятии решений. Что будет дальше?



Сегодня машины решают задачи главным образом по тем правилам, которые мы в них закладываем. Однако недалеко то время, когда мы, возможно, научимся настраивать их таким образом, чтобы они могли работать над очень важной проблемой совершенствовании собственной способности решения задач. При этом может случиться так, что после перехода через некоторый порог способности машины будут расти все быстрее, словно по спирали удаляясь от исходной точки, так что создание надежного их "регулятора" окажется совсем нелегким делом"**.

Складывается впечатление, что нет предела размаху и великолепию надлежащим образом запрограммированной ЭЦВМ, Неудивительно поэтому, что среди тех, кто занимается философией науки, встречается мнение, согласно которому машина в состоянии делать все, что в состоянии делать человек (это сопровождается попыткой представить себе, чем такая точка зрения чревата для философского осмысления разума); в то же время некоторые моралисты и теологи не на жизнь, а на смерть защищают такие в высшей степени утонченные формы поведения, как моральный выбор, любовь и творчество, считая их находящимися вне досягаемости машины. Однако мыслители как того, так и другого

* А. Тьюринг. Цит. соч., с. 32.

** M.Minsky. Machines Are More Than They Seem.-Science Journal, 1968, October, p. 3,

22

толка оставляют без внимания вопрос, который должен был бы предшествовать всем остальным, а именно: действительно ли машины могут достичь хотя бы элементов творчества, играя в шахматы, разрешая простые проблемные ситуации, читая простые предложения и распознавай образы? По-видимому, это связано с тем, что под влиянием прессы и таких исследователей, работающих в области "искусственного интеллекта", как М. Минский, у них сложилось впечатление, что простые задачи - и даже некоторые из очень трудных - уже решены или находятся на пороге решения. Поэтому прежде всего займемся проверкой этих заверений.

Уместно начать с предсказания, сделанного Г.Саймоном в 1957 г., когда, казалось, его "Общий решатель задач" открывал эру искусственного интеллекта:

"В мои намерения не входит удивить или поразить вас. То, что я хочу сказать, можно выразить в нескольких словах: в настоящее время в мире существуют машины, которые мыслят, учатся и проявляют способность к творчеству. Более того, эти их способности будут быстро расти вплоть до того момента в обозримом уже будущем, когда сфера их деятельности охватит круг всех вопросов, над которыми когда-либо размышлял человеческий разум".



Далее Саймон продолжает:

"1. Не пройдет и десяти лет, как цифровая вычислительная машина станет чемпионом мира по шахматам, если не будут введены правила, не допускающие ее к соревнованиям.

2. Не пройдет и 10 лет, как вычислительная машина найдет и докажет важную и до сих пор неизвестную математическую теорему.

3. Не пройдет и десяти лет, как большинство психологических теорий примет форму программ для вычислительных машин или качественных утверждений о тех или иных характеристиках машинных программ”*

К сожалению, десятая годовщина этого исторического выступления прошла незамеченной, а исследователям "искусственного интеллекта" ни на одной из своих многочисленных конференций (как международных, так и внутри США) так и не удалось выкроить время между докладами, посвященными их успешной работе, чтобы сопоставить эти предсказания с реальными результатами. До настоящего момента прошло уже четырнадцать лет20, и нас по-прежнему предупреждают, что, быть может, вскоре нам будет трудно справляться с нашими роботами. Вне всякого сомнения, давно пора сопоставить эти своеобразные пророчества с действительностью.

По прошествии пяти лет после предсказаний Саймона в опубликованных работах появились намеки на то, что первое из

* H.A.Simon, A.Nеwell, Heuristic Problem Solving: The Next Advance »n Operations Research. Operations Research, voL 6, 1958, p. 6 .

23



его предвидений уже наполовину осуществилось, а в отношении второго наблюдается значительный прогресс. Что касается этого последнего, то есть предсказания о машинных открытиях теорем, то его стали считать "исполнившимся" после того, как У.Р.Эш-би - один из ведущих авторитетов в этой области - в произведенном им обзоре коллективного труда "Вычислительные машины и мышление", вышедшего под редакцией Э.Фейгенбаума и Дж. Фельдмана, поделился своими восторгами по поводу математических способностей надлежащим образом запрограммированной ЭВМ: "Программа Гелернтера для доказательства теорем нашла новое доказательство теоремы pons asinorum, которое не требует никаких построений". Это доказательство, продолжает доктор Эшби, "в течение 2000 лет оставалось незамеченным величайшими математиками.,, будь оно найдено, это доказательство получило бы самую высокую оценку"*.

Машинная теорема выглядит внушительно, и наивный читатель невольно начинает разделять энтузиазм У.Эшби. Однако небольшое углубление в вопрос показывает, что pons asinorum, или «ослиный мост», есть не что иное, как элементарная теорема, доказываемая в геометрии Евклида21; согласно этой теореме, в равнобедренном треугольнике углы, лежащие против равных сторон, равны. Более того, первое упоминание об этом будто бы новом доказательстве, "открытом" машиной, приписывается Пап-пу Александрийскому, жившему в конце III - начале IV в. н.э.** Несоответствие между ликованием Эшби, древностью теоремы и тривиальностью ее доказательства просто поразительно. Нет, мы еще весьма далеки от "важной математической теоремы", которая должна была быть найдена к 1967 году!

История с игрой в шахматы более запутана, она могла бы послужить моделью для изучения процесса возникновения интеллектуального смога, В 1958 г,, через год после предсказания Саймона, появилась тщательно разработанная шахматная программа Ньюэлла, Шоу и Саймона. Как указывалось в их классической работе, названной "Программа для игры в шахматы и проблема сложности", эта программа была "еще полностью не отлажена", так что о ее поведении имелся "лишь небольшой фактический - материал"***; тем не менее авторы предполагают, что принципов, заложенных ими в программу, достаточно для разыгрывания дебютов. Это была последняя подробная публикация, посвященная данной программе. Однако в том же году Ньюэлл, Шоу и Саймон

* W,R. Ashby. Review of E.A. Feigenbaum and J.Feldman feds,). Compu­ters and Thought. The Journal of Nervous and Mental Diseases, vol. 140, No 6, June 1965, p. 468^70.

** D.E. Smith. History of Mathematics. Boston, Ginn, 1925, vol. II, p. 284,

*** A, Newell, J, Shaw and H.Simon, Chess-Playing Program and the Problem of Company, p.60.

24

провозгласили: "Мы составили программу, играющую в шахматы"*. На основе этого заявления Саймон пересмотрел сделанное им ранее предсказание:



" В одной из наших публикаций мы предсказывали, что не пройдет и десяти лет, как ЭЦВМ откроет и докажет важную математическую теорему. Исходя из опыта нашей работы с эвристиками в логике и шахматах, мы готовь/ добавить к этому дополнительное предсказание: понадобится всего лишь незначительное развитие возможностей уже существующей программы для того, чтобы достичь необходимого для такого рода моделирования увеличения ее мощности в решении задач" **.

Доверчивость читателей и энтузиазм Саймона были столь велики, что одних только заверений Ньюэлла, Шоу и Саймона, касающихся их все еще не отлаженной программы, оказалось достаточно, чтобы шахматная машина была запущена на орбиту научной мифологии. В 1959 г. Н.Винер, развивая утверждение Саймона об умении программы "хорошо разыгрывать дебюты", сообщил Институту философии Нью-Йоркского университета, что "машины, играющие в шахматы, типа тех, которые существуют уже сегодня, будут отвечать на ходы мастера ходами, которые рекомендуются для таких позиций в учебниках; на этом уровне машина сможет продолжать игру вплоть до определенного момента в миттельшпиле"***. На том же симпозиуме М. Скрайвен перешел от расплывчатых заверений типа "машины теперь играют в шахматы" к более сильному утверждению о том, что "способности машины уже позволяют ей вести хорошую игру"****.

На самом же деле в нескольких зарегистрированных играх программа Ньюэлла, Шоу и Саймона играла слабо, хотя и по правилам, а в официальной схватке в октябре 1960 г. она проиграла на 35 ходу десятилетнему начинающему шахматисту. Этот факт, однако, не имеет отношения к делу.

В то время как программа Ньюэлла, Шоу и Саймона терпела поражение в плохо сыгранных ею пяти-шести партиях, а порожденная теми же авторами мифическая программа успешно противостояла шахматным мастерам вплоть до миттельшпиля, сами авторы хранили молчание. Когда же года три спустя они вновь обрели дар речи, то сообщили не о трудностях и разочарованиях, а скорее наоборот: как бы продолжая прерванное изложение мифа, в статье, опубликованной в журнале "Behavioral Science", Саймон

* A. Newell, J.Shaw and H. Siтоn, - The Processes of Creative Thinking, The RAND Corporation, P-1320, September 16, 1958, p, 6,

** ibld., p. 78.

*** N.Wiener. The Brain and the Mashine (Summary).-In: Dimensions e, 1961, p. 110,

**** Scriven, The Complete Robot: A Prolegomena to Androidologyp.122



25

объявил о создании программы, которая гложет играть "высокотворческие" шахматные эндшпили, включающие "комбинации, не уступающие по сложности любым из тех, которые вошли в историю шахмат"*. Тот факт, что программа ограничивается только рассмотрением эндшпилей, в которых можно непрерывно шаховать противника, что значительно сокращает перебор вариантов, лишь упоминается, но не подчеркивается. Искусственно создается впечатление, что такие же простые эвристики достаточны для ведения игры на уровне мастера даже в миттельшпиле**. Таким образом, у читателя создается впечатление, что та часть предсказаний, которая касается шахмат, почти реализована. С такими достижениями можно хоть сегодня претендовать на титул чемпиона мира по шахматам. И действительно, один из специалистов по вычислительным машинам назвал прогноз Г.Саймона, рассчитанный на десять лет, "консервативным"***. Другой ученый - Ф. Грюнбергер из корпорации RAND - намекнул, что титула чемпиона мира недостаточно и что следует стремиться к созданию "программы, которая играла бы лучше любого шахматиста"****. Эта новая волна тумана наводит на мысль о загадочном звере из французской легенды, который мог дышать только дымом, им же извергаемым.

А действительность, прихрамывая, плетется позади этих впечатляющих заверений. Замешательство, вызванное моей попыткой привлечь внимание исследователей в области "искусственного интеллекта" к несоответствию между их энтузиазмом и по-

* Н. A. Simоn and P.A. Simon. Trail and Error Search in Solving Difficult Problems: Evidence from The Game of Chess,- Behavioral Science vol. 7 1962, October, p. 429.

** Например, в резюме к работе Г. Саймона и П. Саймона 1см. предыдущее примечание) даже не упоминается, что речь идет о форсированных матах; авторы просто заключают, что "в этой работе делается попытка до какой-то степени рассеять мифический туман, окутывающий игру в шахматы; мы показали, что успешное решение задач основывается не на чудесном даре воспоминания и озарения, а на некоторой эвристической "программе", обладающей высоким уровнем избирательности" (р. 425) , А в заключении к самой статье делается ничем не оправданное обобщение: "Из приведенных данных следует совершенно определенный вывод: мастерам шахматной игры удается находить те или иные комбинации не потому, что они быстрее думают или лучше запоминают, чем другие люди, а потому, что их программы реализуют мощные эвристики выбора" (р. 429). Если к приведенным данным отнестись честно, то из них в лучшем случае следует, что этот вывод применим лишь к некоторым конкретным ситуациям эндшпиля,

*** См,: Р, Армер, О возможностях кибернетических систем22. - В кн.: М. Таубе. Вычислительные машины и здравый смысл- Миф о думающих машинах, 1964, с. 181.

**** F.Grunberger, Benchmarks in Artificial Intelligence.-The RAND Corporation, P-2586, 1962, June, p. 6.

26



лученными результатами, в конце концов привело к появлению более или менее компетентной программы. "Мак Хэк" - программа, написанная Р. Гринблатом, -действительно победила автора этих строк*, типичного шахматиста-любителя, и приняла участие в нескольких турнирах, где выиграла некоторое количество партий. Этот скромный успех возродил былые надежды и претензии. С.Пейперт, второе по рангу лицо в реализации программы разработки роботов в Массачусетсом технологическом институте, выступил в защиту предсказания Саймона, заявив, что "в качестве формулировки ближайших целей, которые исследователи в данной области считают достижимыми, оно вполне разумно"**. А на первой странице октябрьского выпуска "Science Journal" за 1968 г. Д.Мичи, возглавляющий исследования в области "искусственного интеллекта" в Англии, писал: "Сегодня машины могут играть в шахматы на уровне чемпионов"***. Однако, как сказал при обсуждении первых шахматных про* грамм шахматный мастер А. де Гроот, "машины все еще очень слабо играют в шахматы, и у меня мало надежд на существенное улучшение их игры в будущем". Другой шахматист, Э.Херст, обсуждая на страницах журнала "Psychology Today" шахматную программу, составленную в Массачусетском технологическом институте, добавляет, что, хотя "замечание де Гроота было сделано в 1964 г., результаты, полученные "Мак Хэк" на последнем турнире, не изменили бы его мнения"****. То же можно сказать и о положении дел в настоящее время. Программа Грин-блата постепенно усовершенствовалась; однако она достигла, по-

* Ликование, охватившее "машинные" круги в связи с сообщением об этом новом успехе, который якобы подтверждает обоснованность предшествующих заявлений о возможностях ЭВМ, нашло отзвук в книге А. Тофлера "Грядущий шок" (А. Тоffler, Future Schock, New York, Random House, 1971, p. 187). По словам этого автора, я будто бы утверждал, что ни одна вычислительная машина никогда не сможет играть в шахматы даже на любительском уровне. Если взять эту цитату в контексте, то станет ясно, что автор искажает смысл сказанного мною. Мое утверждение сводилось просто к объективной констатации уровня развития программирования шахмат на тот момент (1965 г.), когда оно было выдвинуто: "В соответствии с оценкой, даваемой Ньюэллом, Шоу и Саймоном программам Лос-Аламосской группы исследователей, группы исследовательского центра фирмы IBM и их собственной, "все три программы играют приблизительно на одном уровне (посредственном), затрачивая при этом приблизительно одно и то же машинное время". Однако ни одна шахматная программа не в состоянии вести игру даже на уровне любителя, в то время как до мирового чемпионата по шахматам осталось только два года".

** S. Рарert\ 9th RAND Symposium, 1966, November 7, p, 116.

*** D. Miсhie. Machines that Play and PJan.-"Science Journal/' vol. 4-. 1968, No. 10, October, p. 83.

**** E. Hearst. Psychology Across the Chessboard.-Psychology Today 1967, June, p. 32.

27

видимому, некоторой точки "насыщения". За прошедшие два года она проиграла все партии в турнирах, в которых принимала участие, и больше о ней не упоминалось. Вскоре мы увидим, что, учитывая ограниченные возможности вычислительных машин, именно этого и следовало ожидать.

К чести Р. Гринблата следует сказать, что, даже когда его "Мак Хэк" находилась в зените славы, он избегал предсказаний; что же касается прогнозов Саймона и вопроса об участии ЭВМ в борьбе за шахматную корону, то заметим только, что десять лет давно прошли, а вычислительная машина в лучшем случае в состоянии претендовать в шахматах на категорию С23, то есть любительскую категорию*.



Надеюсь, что этот беглый обзор положения дел в данной области и его сопоставление с обоими предсказаниями Салопа прояснили существующую ситуацию. Очень важно с самого начала отдавать себе отчет в том, что, несмотря на всякого рода предсказания, сообщении в печати, демонстрации кинофильмов и т.д., "искусственный интеллект" все еще остается обещанием, а не свершившимся фактом. Только при этом условии мы можем начать исследование реального положения дел и будущих перспектив, касающихся "искусственного интеллекта” на достаточно изначальном уровне.

В области "искусственного интеллекта" существует множество делений и подразделений, но самые важные работы можно сгруппировать в следующие четыре направления: программирование игр, автоматический перевод, решение задач24 ц распознавание образов. Какого уровня достигли исследователи в программировании игр, мы уже видели. Ниже мы займемся более детальным анализом остальных трех направлений. Основной тезис, развиваемый мною в части I, сводится к тому, что в области "искусственного интеллекта" ход событий следует одной и той же схеме: первоначальный впечатляющий успех быстро сменяется неожиданными трудностями. Эта схема присутствует во всех четырех областях, реализуясь в два этапа, каждый из которых

* Третье предсказание - о том, что большинство психологических теорий примут форму программ для ЭВМ, - действительно до некоторой степени осуществилось, хотя в психологии до сих пор имеется немало "чистых бихевиористов”. Однако действительно важным является не решение тех или иных задач, пусть даже весьма значительных (например, составление программ игры в шахматы на уровне мастера или доказательство нетривиальных теорем), а то, представляет ли реализация некоторого предсказании фактический шаг вперед. Так, неясно, насколько плодотворным а психологии оказывается переход от "поведенческих" моделей к моделям машинным. Этот вопрос достаточно сложен и требует подробного обсуждения (см. гл. 4).

28

длится приблизительно пять лет. С 1957 по 1962 г. (гл. 1) в основном велись работы по моделированию познавательных процессов, заключавшиеся в использовании эвристического программирования для машинного воспроизведения человеческого поведения; при этом предпринимались попытки имитации тех мыслительных переходов, которыми человек фактически пользуется. На втором этапе (гл. 2) центром тяжести стало изучение процессов переработки семантической информации. Здесь термин "искусственный интеллект" приобрел более узкий смысл, чем тот, который я в него вкладывал в предшествующем изложении.

ИИ {я буду использовать такое сокращение для обозначения этого более узкого смысла} представляет собой попытку моделирования разумного поведения человека с помощью таких методов программирования, которые не имеют или почти не имеют сходства с мыслительными процессами человека. Трудности, с которыми мы сталкиваемся при таком подходе, уже начали проявляться. Остальные главы части I касаются вопроса о том, какова основная причина всех этих, казалось бы не связанных между собой, неудач.

Однако все практические трудности и провалы ни в коей мере не приводят в отчаяние самих исследователей: создается впечатление, что их оптимизм растет с каждым новым разочарованием. Поэтому мы вынуждены заняться вопросом о том, какие предпосылки заложены в столь стойком к постоянным неудачам оптимизме, В части II предпринимается попытка выявить четыре допущения, четыре глубоко укоренившихся предрассудка, которые мешают видеть всю серьезность создавшегося безвыходного положения и прояснить путаницу понятий, порождаемую этими предрассудками.

Эти предрассудки столь глубоко укоренились в нашем сознании, что кажется, будто единственной альтернативой дли" них может быть обскурантистское отрицание всякой возможности точной науки о человеческом поведении. В части III мы попытаемся отвести это опасение (в той мере, в какой его можно вообще отвести), предлагая некоторую альтернативу упомянутым традиционным допущениям; последняя основывается на идеях, выдвинутых теми мыслителями XX столетия, в работах которых имплицитно содержится критика "искусственного интеллекта", - идеях, которые до сих пор не рассматривались под таким углом зрения.



На этой основе в заключение становится возможным выявление основных характеристик "искусственного разума" и указание его возможностей и его ограничений. Это в свою очередь создает базу для разграничения различных форм разумного поведения и оценки, в какой степени каждая из них может быть предметом программирования - как с практической точки зре-

29

ния, так и в принципе.

В некотором ограниченном круге вопросов ИИ может - и, по всей вероятности, будет - иметь практическую ценность, несмотря на те ограничения, которые, как я попытаюсь показать в дальнейшем, являются фундаментальными. (Я ограничиваюсь рассмотрением только ИИ, ибо все еще неясно, может пи то наивное моделирование человеческого процесса познания - в том виде, в каком оно имеет место сегодня, - иметь вообще какую бы то ни было ценность, кроме, может быть, той, что оно служит нагляднейшим доказательством того факта, что человек, демонстрирующий разумное поведение, обрабатывает информацию не так, как это делает эвристически запрограммированная ЭЦВМ.) Устройства специального назначения могут заменять человека при выполнении некоторых задач, например в исследованиях других планет; при этом они не обязательно должны действовать так же, как человек, и проявлять свойственную человеку гибкость. Неверно говорить, что исследования в этой области не имеют смысла, хотя следует заметить, что определенное философское осмысление вопроса и здесь способствовало бы выработке более трезвого взгляда на то, чего можно и чего нельзя ожидать от такого рода устройств.

30




Часть I



ДЕСЯТЬ ЛЕТ ИССЛЕДОВАНИЙ В ОБЛАСТИ

"ИСКУССТВЕННОГО ИНТЕЛЛЕКТА"

(1957-1967)

Глава 1. ПЕРВЫЙ ЭТАП (1957-1962)

МОДЕЛИРОВАНИЕ ПРОЦЕССОВ ПОЗНАНИЯ

I. Анализ работ в области машинного перевода, решения задач и распознавания образов



Машинный перевод

В области машинного перевода успехи наметились раньше, чем в других областях: именно здесь велись наиболее интенсивные исследования, именно сюда вкладывалось больше всего средств и именно здесь неудачи были наиболее очевидны. Очень скоро выяснилось, что сконструировать машинный словарь, в котором лингвистические единицы, будь то части слов, целые слова или группы слов, могли бы одна за другой независимо от контекста переводиться в соответствующие единицы другого языка, не представляет большого труда. А. Эттингер, автор первого машинного словаря (1954), так описывает настроение тех дней: "Представление о ...полностью автоматизированном высококачественном машинном переводе, распространяемое чересчур рьяными пропагандистами машинного перевода... и взлелеянное теми, кто в нем заинтересован, однако принимает желаемое за реальность, разрослось, как буйный сорняк"*. Этот первоначальный энтузиазм и сменившее его затем отрезвление образуют своего рода клише для всех работ в этой области. В докладе "Современное состояние автоматического перевода" об этом очень удачно сказал И.Бар-Хиллел:

"В течение первого года работы над машинным переводом были достигнуты значительные успехи..- В результате этого специалисты, работающие в данной области, прониклись уверенностью, что реально работающая система находится где-то очень близко, буквально за ближайшим поворотом. И хотя причины появления в то время подобной иллюзии вполне понятны, тем не менее это была лишь иллюзия. Она возникла... в связи с тем, что решение довольно значительного числа задач не вызвало затруднений... Еще не до конца был осознан тот факт, что разрыв между этими результатами... и собственно высококачественным переводом все еще огромен. К тому времени удалось решить лишь наиболее простые задачи, и, хотя их было действительно много, по-прежнему "несколько"

* A.G.Oettinger. The State of the Art of Automatic Language Translation: An Appraisal, -in Beitraege zur Sprachkunde und Informations Verarbeit-ung, KMarchl (ed,)r vol. 1, H. 2, Munich, Oldenbourg Verlag, 1963, p. 18.

33



наиболее сложных задач оставались нерешенными. Это были по-настоящему сложные задачи"*.

За десять лет, прошедших с момента появления машинного словаря, пять государственных агентств потратили около 20 млн. долларов на исследования в области автоматического перевода**. Несмотря на восторги журналистов по поводу того, что машинный перевод стал наконец реальностью, единственным результатом этих исследований явилось более глубокое осознание неожиданной сложности языковых синтаксиса и семантики. И, по замечанию А.Эттингера, "остается нерешенной основная задача - задача выбора в языке, на который мы переводим, подходящего слова, соответствующего исходному слову в данном контексте. Не решена также родственная задача установления однозначной синтаксической структуры предложения,- структуры, единственность которой для человека очевидна"***. В заключение А. Эттингер пишет; "Для тех, кто до сих пор лелеет надежду на получение полностью автоматического высококачественного машинного перевода, перспективы весьма неутешительны"****.

Так обстояло дело в 1963 г. Три года спустя в правительственном отчете "Язык и машины", изданном Научно-исследовательским советом при Национальной академии наук СШАГ был подведен итог буму, созданному вокруг машинного перевода.

Тщательно сравнив переводы, сделанные человеком и машиной, комиссия пришла к выводу:

"Как мы уже отмечали, несмотря на то что уже в настоящее время существует перевод научного текста средней трудности, выполняемый с помощью машины, полностью автоматического перевода, которым можно было бы пользоваться, у нас нет. Более того, его не следует ожидать ни завтра, ни в обозримом будущем"*****.

* Y. Ваr-Нillel The Present Status of Automatic Translation of Lan-guages.ln: Advances in Computers, F.L.A I t {eel). New York, Academic Press, 1960, vol. t, p. 94.

** Language and Machines, National Academy of Sciences, Washington, 1966,p. 29. .

*** A.G.Оettinger. Op. cit, p. 21.



**** Ibid., S. 27. Часто такого рода критические оценки работ по машинному переводу заканчиваются обескураживающим заключением, что, мол, проделанная работа во всяком случае помогает глубже понять структуру языка. Однако даже это оправдание весьма сомнительно. Н. Хомский (1968 г.) относится с недоверием к такого рода "уверткам"; "Ощутимые затраты времени, энергии и денег на применение вычислительных машин в лингвистическом исследовании (ощутимые в рамках такой небольшой области, как лингвистика) не обеспечили сколько-нибудь значительного прогресса в нашем понимании использования языка и его природы. Это резкие суждения, но я думаю, они аргументированы. Они к тому же практически не оспариваются активными исследователями в области лингвистики и психолингвистики" (Н. Хомский. Язык и мышление, с. 16),

***** Language and Machines, p. 32

34

С тех пор как возникли надежды на машинный перевод, прошло 10 лет. В то время еще полет на Луну казался научной фантастикой, а создание механического секретаря было где-то "за ближайшим поворотом". Сегодня мы уже совершили посадку на Луне, а машинописный научный текст для автоматического перевода - не говоря уже о разговорной речи и более общем материале-все еще за горизонтом, и горизонт этот, по-видимому, удаляется от нас со всевозрастающей скоростью. Поскольку надежды на создание роботов вроде тех, которые показаны в фильме "2001 год", или хотя бы более скромных "слуг" большей частью зависят от степени понимания природы естественного языка (что необходимо также и для машинного перевода), заключение Национальной академии наук наносит удар сразу по всем предсказаниям - в том числе и по предсказаниям М.Минского - о том, что уже следующее поколение в основном решит проблему создания искусственного интеллекта.

Решение задач

Толчок большинству работ по “искусственному интеллекту” , и особенно по моделированию игр и решению задач, на начальном этапе дали исследования А.Ньюэлла, Дж.Шоу и Г.Саймона в корпорации RAND и в Технологическом институте Карнеги*; эти исследования оказали влияние на последующие работы в данных направлениях. Упомянутые авторы назвали свой подход "моделированием процесса познания", так как основная методика, которую они использовали, заключалась в получении от испытуемых отчетов о ходе их рассуждений и последующем анализе отчетов с целью выявления эвристик, к которым испытуемые прибегали**. Затем на основе таких "чисто эмпирических правил" писалась программа для ЭВМ.

Наиболее существенные работы, содержащие описание результатов исследований, которые проводились в тот период, включены в вышедший в 1963 г. коллективный труд: E.Feiqenbaum and J.Feldman (eds.)-Computers and Thought. A collection of articles- New York-San Francisco- Toronto-London-

Под "отчетом*" - протоколом эксперимента - следует понимать устное изложение испытуемым процесса своего рассуждения при решении задачи. Вот типичный отчет человека, решающего логическую задачу: "Ну что же, взглянув на левую часть уравнения, нам сначала хочется уничтожить одну из частей, используя правило 3. Однако оно кажется слишком сложным для того, чтобы начинать с него. Тогда,.. нет, нет, R не могу этого сделать, так как я тогда уничтожу либо О, либо Р в том общем выражении. Я не хочу с этого начинать. Поищу-ка способ избавиться от "подковы" внутри лары скобок в левой и правой частях уравнения. Я не вмжу, как это можно было бы сделать. Ага, если применить правило 6 к обеим частям уравнения, то после этого станет видно, можно ли применить правило 7'' (Вычислительные машины и мышление, с. 287) 25.



35

И в данном случае начало работы было успешным: в 1957 г. программа "Логик-теоретик" Ньюэлла, Саймона и Шоу на основе эвристически направляемого метода проб и ошибок доказала 38 из 52 теорем из труда "Principia Mathematica". Спустя два года программа "Общий решатель задач" на основе более изощренной процедуры в терминах "средств и целей" решила задачу о людоедах и миссионерах, а также ряд других задач той же степени сложности*.

В 1961 г. после сравнения машинной выдачи с протоколом эксперимента (который до некоторой степени соответствовал машинному результату) Ньюэлл и Саймон сделали довольно осторожный вывод.

"Фрагментарные результаты, которые мы имеем на сегодняшний день, позволяют нам заключить, что "Общий решатель задач" дает неплохое первое приближение к теории информационных процессов, касающейся некоторых форм мышления и поведения при решении задач. Процесс "мышления" уже нельзя более считать полностью таинственным"**.

Вскоре, однако, Саймон приходит к более оптимистическим заключениям:

«Последующая работа подтверждает справедливость [наших] первоначальных догадок и показывает, что эвристики, или чисто эмпирические правила, образуют целостное ядро процессов решения проблем человеком. По мере проникновения в природу эвристик, которыми люди пользуются в процессе мышления, становятся еще менее загадочными такие [до сих пор] смутно понимаемые процессы, как "интуиция" и "рассудок"» ***.

Но, как и в случае лингвистического перевода, трудности вновь и вновь напоминали о себе. На этот раз "загадочность" рассудка оказывает влияние на организацию программ по решению задач. Уже в 1961 г., когда энтузиазм Саймона достиг кульминационной точки. Минский хорошо видел трудности, которые неизбежно возникают при попытке использовать метод проб и ошибок для решения действительно сложных задач:

"Простейшие задачи, например программирование игры в крестики и нолики или доказательство самых элементарных теорем математической логики, могут быть решены с помощью простого рекурсивного использования имеющихся преобразований, применяемых к соответствующей ситуации; при этом отдельные подзадачи решаются по мере их возникновения.



* Н. A. Simоп. Modeling Human Mental Processes.-The RAND Corporation, P-2221, 1961, February 20, p. 15. Следует иметь в виду, что эти задачи уже имели решение. Было опубликовано несколько обычных, не содержащих эвристик математических алгоритмов, дающих решение и подобных, и более сложных задач рутинного характера.

** А.Newell and H.A.Simon. Computer Simulation of Human Thinking.-The RAND Corporation, P-2276, 1961, April, 20; опубликовано также в "Science", vol, 134, 1961, December 22, p. 19 (курсив мой.-Х.Д.) 27. *** H.A.Simon. Op. cit., p. 12

36

{схемы}

37

Такой метод становится непрактичным при решении более сложных задач,, поскольку пространство поиска увеличивается и каждая проверка требует все больших затрат времени и усилий. Здесь уже нельзя позволить себе простого отбрасывания неудачных вариантов с переходом к последующим. Поскольку каждая попытка решения трудной задачи требует очень больших усилий, нужно быть достаточно уверенным в том, что независимо от результатов эти усилил в какой-то мере себя оправдывают. Поэтому следует быть крайне осторожным и не допускать ни одной проверки без достаточно веских оснований"*.

Из сказанного, как полагает М.Минский, следует необходимость планирующей программы; однако далее он пишет:

"Методы планирования... оказываются под угрозой провала тогда, когда фиксированные наборы понятий, адекватных для простых задач, приходится заменять выражениями из дескриптивного языка"**.



В работе " Некоторые вопросы исходной организации Программ по решению задач" (1962) Ньюэлл, обсуждая некоторые проблемы, возникающие при организации шахматных программ - "Логика-теоретика" и особенно "Общего решателя задач" - откровенно признает, что "большинство [этих проблем] либо решены частично, либо полностью не решены, либо найденное решение неудовлетворительно в том или ином аспекте"***. С тех пор не появилось никаких данных, свидетельствующих о разработке удачной иерархической организации эвристических программ. (Любопытно, что величайшее достижение в области машинного доказательства теорем - программа, созданная Хао Ваном28, которая доказала менее чем за 5 минут все 52 теоремы, с которыми экспериментировали Ньюэлл, Шоу и Саймон,- абсолютно не использует эвристик.)

Однако публичное признание того факта, что работа над "Общим решателем задач" зашла в тупик, произошло значительно позднее. В 1967 г., спустя ровно десять лет после предсказания Г.Саймона, А.Ньюэлл (и Дж.Эрнст) спокойно, трезво, хотя несколько неопределенно, заявил, что работа над GPS прекращается****. Ясно, что программа GPS не выдержала тяжести своей собственной организации. Раздел их работы, названный "Общность и GPS", кончается словами:

"Размеры программы и объем соответствующей тщательно разработанной структуры данных сильно ограничивает предполагаемые возможности

* М.Мinsky. Descriptive Languages and Problem Solving,-In; Proceedings of the 1961 Western Joint Computer Conference; перепечатано в: Semantic Information Processing, M.Minsky (ed), Cambridge, Mass., 1968, p- 420.

** Ibid, p. 420.

*** A. Newel I. Some Problems of Basic Organization in Problem-Solving Programs.- The RAND Corporation, RM-32S3-PR, 1962, December, p. 4.

**** G. W.Ernst, A.Newelf. Generality and GPS,-Carnegie Institute of Technology, 1967, January, p. I

38



GPS- Сама программа занимает внушительную часть запоминающего устройства машины, и построение новых структур данных в процессе решения задачи быстро исчерпывает остатки памяти. Поэтому GPS предназначена для решения только простых задач, представление которых не слишком запутано. Несмотря на то что больший объем запоминающего устройства сделал бы более приемлемым расточительное использование машинной памяти, характерное для GPS, тем не менее концептуальные трудности остались бы непреодоленными"*

Этот переход от первых успехов к энтузиазму, а потом к разочарованию в полученных результатах в меньшем масштабе можно проследить и в случае программы для доказательства геометрических теорем Г.Гелернтера (1959). Поначалу успешная работа с теоремами, подобными теореме pons asinorum, послужившая поводом для тех предсказаний, о которых мы говорили ранее, оказалась полностью дискредитированной. В статье, опубликованной в 1960 г., Гелернтер, объясняя характер эвристик, используемых в его программе, в заключение говорит29: 'Три года назад преобладало мнение, что геометрическая машина не будет создана к настоящему времени. Ныне же специалист вряд ли будет оспаривать, что через три года машина будет доказывать интересные теоремы из области арифметики"** (то есть в 1963 г.). С тех пор от Г.Гелернтера ничего не было слышно, равно как ничего не слышно и о дальнейшем прогрессе в области "чисто механической математики".

Распознавание образов

Эту сферу исследований мы рассматриваем в последнюю очередь, так как трудности, препятствующие дальнейшему развитию программирования игр, машинного решения задач и автоматического перевода, могут быть преодолены только после продвижения в машинном распознавании образов (для чего в свою очередь необходимо решить вопросы, возникающие в вышеупомянутых областях). Как подчеркивают в своей ставшей классической работе "Машинное распознавание образов" О.Сэлфридж и У.Ниссер:

"В каждый момент на человека через органы чувств обрушивается лавина информации, из которой он абстрагирует образы, имеющие отношение к его деятельности в данный момент. Его способность решать задачи, доказывать теоремы и вообще существовать зависит от этого типа восприятия. Мы полагаем, что до тех пор, пока не будут созданы программы.

* Ibid., р. 45.

** Г.Гелернтер,Дж.Хазен и Д. Лэвленг.Экспериментальное исследование машины для доказательства геометрических теорем.-В кн.: Вычислительные машины и мышление, с. 173

39



воспринимающие образы, всякое достижение в машинном решении задач будет просто отдельным техническим успехом".*

Как обычно, и в этой области исследований в начале ее развития наблюдается блестящий успех. Так, в лаборатории Линкольна группа под руководством Б.Гоулда составляет программу для распознавания рукописных знаков азбуки Морзе. Позднее пишутся программы распознавания ограниченного набора рукописных слов и печатных букв различных шрифтов. Все эти программы осуществляют поиск заранее заданных топологических признаков подлежащих распознаванию букв и затем сверяют найденные характеристики с "определениями" каждой буквы, данными в терминах этих признаков. Эти определения либо формулируются заранее, либо вырабатываются в процессе обучения. Все дело в том, чтобы найти существенные свойства изображений, то есть такие, которые остаются инвариантными при изменениях их размеров, ориентации и прочих искажениях. Как это ни удивительно, такой подход действительно приводит к успеху в тех случаях, когда узнавание зависит от небольшого числа специфических признаков.

Однако ни одна из этих программ не может претендовать на принципиальное решение задачи распознавания образов. Каждая из них- маленький триумф изобретательного программиста,, решение ad hoc, придуманное для специфической задачи, которое не допускает обобщения и распространения на другие задачи30. М-Иден - один из ведущих специалистов в данной области-пишет в своем обзоре работ по распознаванию образов, выполненных до 1968 года:

"В тех случаях, когда удавалось создать искусственные устройства, способные к распознаванию образов, это было достигнуто с помощью методов, выбранных специально для каждой данной задачи; иными словами, эти эффективные методы обеспечивают надежную классификацию той конкретной совокупности образов, для которых они были разработаны, но, по-видимому, не представляют сколько-нибудь значительной ценности применительно к задаче классификации какой-либо другой совокупности образов"**.

Да и в каждом специальном случае, как справедливо отмечают О. Сэлфридж и У. Ниссер, "машина может получить адекватный набор признаков только от программиста"***. Их статья заканчивается словами, которые можно назвать скорее вызовом, чем предсказанием;

* О. G.Selfridge and U. N е i s s e r. Pattern Recognition by Machine,-In: Computers and Thought, p. 238.

** Распознавание образов. Исследование живых и автоматических распознающих систем^! (гл. VIII "Другие задачи распознавания и некоторые обобщения", написанная М.Иденом), М., 1970, с. 246-247.

*** О.G.Selfridge and U.Neisser. Op. cit., p. 224



40

" Пока еще мы ничего не знаем о самом важном аспекте процесса обучения: ни одна из существующих программ не может сама генерировать признаки, по которым ведется распознавание. Эффективность всех этих программ раз и навсегда ограничена заложенными в них изобретательностью или произволом написавших их программистов. Как избавиться от этой ограниченности, сейчас можно только догадываться, но до тех пор, пока это не сделано, "искусственный интеллект" будет иметь налет искусственности"*.

Однако, быть может, и эти замечания слишком оптимистичны, поскольку основная трудность заключается отнюдь не в генерировании признаков- Относительный успех программы Л.Юра и Ч.Фосслера, которая строит и оценивает свои собственные операторы, показывает, что эта задача до какой-то степени может быть решена**. Но машинное распознавание, которое использует ограниченный набор признаков - независимо от того, специальны ли они или имеют общий характер, заложены ли в программу заранее или вырабатываются самой программой,- почти исчерпало свои возможности. Число признаков, которые можно просмотреть за некоторый обозримый период времени, ограниченко, и сегодняшние программы уже приблизились к этому технологическому пределу- В работе, представленной на Международной конференции по методологии распознавания образов (Гавайи, 1968), Л.Кэнел и Б.Чандрасекаран так характеризуют создавшееся безвыходное положение:

"Очевидно, что инженерный подход неразрывно связан с некоторыми ограничениями. Существует определенный уровень сложности, начиная с которого не помогают уже никакие программистские трюки. Так, хотя опыты по распознаванию печатного текста с различным шрифтом были достаточно успешными, тем не менее, несмотря ни на какие усилия, удовлетворительного решения задачи распознавания рукописного текста найти не удается. Столь же большой разрыв существует, по-видимому, между распознаванием речи, состоящей из отдельных частей, и слитной речи. Надежды, возлагавшиеся на моделирование процессов распознавания у человека, также не оправдались. Вполне вероятно, что именно те проблемы, которые с таким трудом поддаются инженерной мысли, удастся решить только после того, как более глубоко и подробно будут изучены распознающие системы человека. Во всяком случае, ясно, что ощущение кризиса, возникшее в этой области исследований, тесно связано с тем же ощущением в других областях "искусственного интеллекта" - программировании игр и автоматическом переводе"***.

* Ibid,, p. 250.

** См:Л. Юр, Н. Фосслер. Программа распознавания образов, которая вырабатывает, оценивает и улучшает свои операторы. - В кн.; Вычислительные машины и мышление, под ред. Э.Фейтенбаума и Дж.Фельдмана. М., 1967.

*** L. Кanal, В, Chandrasekaran, Recognition, Machine Recognition and Statistical Approaches.-In: Methodologies of Pattern Recognition. New York, Academic Press, 1969, p. 318-319

41

События разворачиваются здесь по той же схеме; на смену оптимизму приходит крушение иллюзий. Зачастую у тех, кто прошел этот путь, даже нет отчетливого понимания, почему их надежды не оправдались; но их недоумения тонут в хоре обещаний и сообщений о небольших технологических достижениях. Один из таких недоумевающих - В.Джулиано, работавший ранее в "Arthur D.Little Corporation ". Будь его оценка заблуждений, имевших место в распознавании образов, несколько более подробной и глубокой, ее, пожалуй, можно было бы сравнить с заключениями А.Эттингера и И.Бар-Хиллела. В. Джулиано пишет:



"Как и многие мои коллеги, я страстно желал найти пути создания того, что мы иногда называем искусственным интеллектом... В середине 50-х годов была начата разработка множества многообещающих проектов, целью которых было наглядное доказательство способности вычислительных машин к обучению и, следовательно, к смысловому переводу, ведению свободного и непринужденного разговора с человеком, распознаванию речи с выводом ее на печать, диагностике заболеваний. Все эти виды деятельности включают в себя выделение и изучение сложных образов.

Всего несколько лет назад мы действительно верили, что в конце концов вычислительным машинам можно будет полностью поручить решение такого рода задач, если суметь запрограммировать их соответствующим образом.

Увы! На мой взгляд, многие наши ожидания, по всей вероятности, опираются на идеи, напоминающие фарфоровые яйца: сколько их ни-высиживай, никто из них не вылупится. Это объясняется тем, что мы возлагаем задачу открытия нового на машину саму по себе. Однако проблемы, связанные с открытием, требуют человеческих способностей"*.

Заключение

К 1962 г., если судить по опубликованным работам, начала вырисовываться общая схема (правда, в некоторых случаях это стало очевидно несколько позже); быстрый и эффектный успех, связанный с нетрудоемкими, простыми задачами, либо весьма неудовлетворительное решение сложных задач; затем снижение эффективности работы, разочарование, подчас пессимизм. Такой ход развития нельзя объяснить давлением, оказываемым на исследователей теми, кто с интересом следит за их работой (как скептики, так и доброжелатели) и требует слишком многого за короткий срок. Для того чтобы понять незначительность полученных результатов, достаточно сравнить обещания с фактами.

Впрочем, даже когда общая ситуация безнадежна, энтузиасты всегда могут обратиться за поддержкой к своему собственному оптимизму. Такая тенденция подменять создание работающей программы долгосрочными прогнозами проскальзывает в ут-

* V.E.Giulianо. How We Find Patterns.- International Science and Technology, 1967, February, p. 40

42



верждении Э.Фейгенбаума и Дж. Фельдмана о том, что предсказания в отношении моделирования познавательных процессов человека являются обнадеживающими*. Что касается предсказаний, то они всегда были таковыми. Однако насколько обнадеживающи перспективы! Фейгенбаум и Фельдман утверждают, что реальный прогресс постоянно ощущается, однако определяется он ими весьма осторожно - как "движение к конечной цели"**. Если следовать этому определению, получается, что первый же человек, взобравшийся на дерево, имеет право утверждать, что сделал шаг к Луне.

Однако вместо того чтобы карабкаться вслепую, не лучше ли попытаться понять, куда мы хотим попасть? Не пора ли серьезно задуматься над специфическими проблемами, стоящими перед создателями "искусственного интеллекта", и теми трудностями, которые стоят на пути их решения?





II. Причина неудач



Отрицательный результат, если, разумеется, мы признаем его таковым, может быть интересен сам по себе. Спад результативной работы, наблюдающийся вместо предсказывавшегося нарастающего успеха, быть может, свидетельствует о том, что мы столкнулись с каким-то неожиданным явлением. Существует, возможно, некая аналогия между исследованиями в области "искусственного интеллекта" и достижением все больших скоростей, где прогресс становится все более и более труднодоступным по мере того, как мы приближаемся к скорости света. Возможно также, что путь к успеху неровен и вместо того, чтобы прилагать все больше усилий в одном направлении, лучше прибегнуть к принципиально другим путям и методам работы, - стремясь к Луне, не обязательно взбираться на дерево.

Казалось бы, вполне естественно критически проанализировать именно эту сторону дела, однако в данной области, как ни странно, до сих пор это не сделано. Между тем если этим заняться, то обнаружится, что каждому из четырех рассмотренных выше направлений противостоят специфически человеческие формы "процессов переработки информации", позволяющие субъекту в сфере своей деятельности преодолевать или обходить трудности, неизбежно возникающие перед создателями "искусственной личности". Ниже мы выделяем четыре такие формы "переработки информации" человеком и сравниваем их с соответствующими машинными суррогатами.

* См : Вычислительные машины и мышление, М. 1967 ** См. там же

43

Эвристически направляемый поиск или периферийное сознание



Общеизвестно, что некоторые игры можно реализовать на современных ЭЦВМ с помощью современных методов программирования. Такие игры, как "ним" или "крестики и нолики", могут быть запрограммированы так, что каждую партию машина либо выиграет, либо сведет к ничьей. Однако существуют игры, которые не могут быть полностью решены на нынешних машинах, но которые тем не менее успешно программируются. Так, например, выясняется, что в игре в шашки существуют надежные способы определения вероятностной оценки хода, использующие такие параметры, как контроль над центром, развитие и другие. Если наряду с этим учесть, что количество ходов здесь относительно невелико, поскольку шашки блокируют друг друга и взятия обязательны, то можно исследовать все варианты на 20 ходов вперед, что вполне достаточно для отличной игры-

В шахматах, однако (хотя для них в принципе возможен полный просчет всех прямых и ответных полуходов), возникает задача, неизбежно связанная с выбором пути в лабиринте-и, значит, с экспоненциальным ростом. Число альтернативных вариантов возрастает настолько быстро, что мы не в состоянии оценить каждую из возникающих возможностей хотя бы на глубину, достаточную для того, чтобы решить, заслуживает ли данный ход дальнейшего исследования. А.Ньюэлл отмечает, что машине потребовалось бы слишком много времени для выбора интересного хода, если бы она исследовала одно за другим положения всех фигур на доске. Он также отдает себе отчет, что если этого не делать, то машина может подчас пропустить какую-нибудь важную и интересную комбинацию. "Мы не стремимся к тому, чтобы машина тратила все свое время на исследование последствий связок фигур; однако если она никогда не будет проводить таких исследований, то может пропустить реальные возможности выигрыша"*.

Первое, что предложил А.Ньюэлл для решения этой задачи,- это введение "случайного элемента". "Машина должна время от времени (то есть совершенно случайно. - Х.Д.) просчитывать варианты, в которых жертвуется ферзь"**. Но это решение неудовлетворительно, как, по-видимому, в настоящее время понимает и сам Ньюэлл. Машина должна не просто время от времени просчитывать последствия жертвы ферзя, а исследовать

* A.Newell. The Chess Machine.ln: The Modeling of Mind, K.M.Sаyre and F.J.Xrosson (eds), South Bend, Ind, Notre Dame University Press, 1963, p. 80.

** Ibid., p. 80.

44

те варианты, в которых такая жертва имеет смысл. Хорошие эвристики как раз и должны обеспечивать подобное поведение, приводя к сокращению числа подлежащих анализу ветвей при сохранении наиболее многообещающих альтернатив.

Однако ни одной такой эвристики на уровне мастера пока не обнаружено. Все существующие эвристики либо исключают некоторые потенциально хорошие ходы - ходы, которые не ушли бы от внимания мастера,- либо оказываются перед лицом экспоненциального роста. Г. Саймон тем не менее убежден (его доводы обсуждаются в части II), что шахматные мастера пользуются такого рода эвристиками. Отсюда его уверенность в том, что если изучать отчеты мастера о принимаемых им решениях, следить за движением его глаз и, быть может, допрашивать ого под светом юпитеров, то можно в конце концов обнаружить эти эвристики и встроить их в программу, сократив тем самым поиск по экспоненциально растущему дереву игры. Давайте, однако, рассмотрим более пристально те данные, из которых якобы следует, что процесс игры в шахматы управляется эвристиками.



Обратимся к протоколу эксперимента, цитируемому Саймоном, придавая особое значение тому, как он начинается (а не тому, чем заканчивается). Шахматист говорит:

"Я опять замечаю, что одна из фигур противника, ладья, не защищена; наверняка существуют какие-то пути использования этого преимущества. Например, я могу продвинуть пешку и напасть на слона; если слон отступит, ферзь противника окажется под ударом и я смогу взять ладью. Если же..." и т. д.*

В конце мы видим пример процесса, который я буду называть "просчитыванием", - продумывание различных возможных вариантов путем простого перебора ходов. Каждому из нас знаком этот процесс: считается, что именно такая процедура, управляемая различными эвристиками, реализуется в игре шахматных мастеров. Однако как же наш шахматист заметил, что ладья противника не защищена? Он что, действительно последовательно (или одновременно) исследовал положение всех фигур противника и возможные способы защиты, до тех пор пока не наткнулся на уязвимую ладью? Для этого ему понадобилось бы рассмотреть слишком много вариантов, ибо, как пишут Ньюэлл, Шоу и Саймон, "по наиболее достоверным данным, человек при выборе хода рассматривает значительно менее ста позиций"**. Что же касается поведения шахматиста, то ему для оценки ситуации пришлось бы в приведенном выше примере рассматривать еще

* A.Newell, H.A.Simоn. Computer Simulation of Human Thinking.-- The RAND Corporation, P-2276, 1961, April 20, p. 15.

** A. Hьюэлл, Дж. Шоу, Г. Саймон. Программа дли игры в шахматы и проблема сложности.- В кн.: Вычислительные машины и мышление, с. 44.

45

массу возможных позиций, которые следуют из незащищенности ладьи противника. Нет необходимости обращаться к интроспекции, чтобы выяснить, что именно делает игрок до того, как начинает просчитывать варианты. Непосредственно из протокола ясно, что игрок "фокусирует внимание" на перспективном варианте ("я замечаю, что одна из фигур противника не защищена") . Только после того, как шахматист обратил внимание на некоторую особенность позиции на доске, он действительно начинает просчитывать и проверять, что можно из нее извлечь.

Анализ шахматной программы "Мак Хэк", составленной Р. Гринблатом, наглядно иллюстрирует разницу между тем, как человек схватывает шахматную позицию, и тем, как машина производит сплошной перебор- Даже "Мак Хэк" не в состоянии просчитать все альтернативы. В программу включен рационально действующий генератор ходов, который оставляет для рассмотрения только более или менее многообещающие варианты. И тем не менее, когда в одной из партий турнира программа однажды крепко "задумалась", она затратила на один ход 15 мин и просчитала 26 000 вариантов, в то время как человек может просчитать их только 100, от силы 200. Программа "Мак Хэк" нашла отличный ход, что, впрочем, отнюдь не означает, что мастер-шахматист не нашел бы лучшего; но в данном случае для нас существенно важно не качество хода, а количественное различие между просчетом в 26 000 и 200 вариантов. При таком разрыве естественно предположить, что человек, играя в шахматы, не только просчитывает варианты, но и производит действия совсем иного порядка. Именно этот вопрос нас и интересует: что же делает человек, благодаря чему ему удается, рассмотрев всего 100 - 200 альтернатив, найти более сильный ход, нежели машина, "прокрутившая" их 26 000.



Шахматист, отчет которого мы цитировали выше, даже не осознает, что он фактически проверил (или фактически исключил из рассмотрения) несколько сот позиций, которые пришлось бы просчитать для того, чтобы путем перебора оценить конкретную ситуацию на шахматной доске. А ведь та конкретная ситуация, на которой в конце концов останавливается внимание испытуемого, зависит от общей позиции. Для того чтобы понять, как все это возможно, рассмотрим феномен, который У.Джемс называл "периферийным сознанием". Тот факт, что мы замечаем тиканье часов только тогда, когда они остановились, являет собой простой пример подобного рода краевого сознания. Другим, более сложным и подходящим к делу примером является то расплывчатое восприятие лиц, какое имеет место, когда мы ищем в толпе знакомого.

Однако невозможно привести вполне адекватный пример

46

феномена такого рода, поскольку речь идет о явлении, которое противоположно процессу явного осознания, основанному на просчитывании. Ни в одном из подобных примеров нельзя с уверенностью сказать, что испытуемый действительно использует информацию, остающуюся на периферийных полях его сознания. Пример с шахматами лучше всего представлять себе в терминах данного М. Поляным общего описания способности краевого сознания концентрировать информацию, относящуюся к нашей "периферической" психической деятельности,

"Эта способность присуща той области, которая имеет тенденцию действовать как фон, потому что располагается она где-то вокруг центрального объекта нашего внимания. Наблюдаемая уголком глаза или хранящаяся в закоулках нашей памяти, эта область неизбежно влияет на то, как мы воспринимаем объект, находящийся в центре внимания. Можно даже сказать, что мы осознаем эту едва замечаемую нами область гпавным образом потому, что на ней мы выделяем тот объект, который привлек наше внимание"*.

Если мы, например, знаем, что такое "дом", то его передняя сторона будет выглядеть "толще", чем собственно фасад, потому что подсознательно мы чувствуем за ней сам дом. Так и в шахматах: связи, соединяющие между собой различные фигуры, оставаясь в периферийном сознании, привлекают внимание шахматиста к ситуациям на шахматной доске, которые он воспринимает либо как многообещающие, либо как опасные или просто стоящие внимания.

А, Ньюэлл и Г.Саймон сами отмечают:

«В шахматной игре человек использует категории гораздо более



* М.Рolanyi. Experience and Perception of Pattern.- In: The Modeling of Mind, p. 214. Насколько я знаю, первым, кто обратил внимание на то, что такого рода гештальтистский анализ имеет отношение к "искусственному интеллекту", был Ф. Кроссон. В предисловии к книге "Модели разума "он пишет: «Некоторые функции человеческого мышления подчас реализуются путем использования информации или неявных ориентиров^, которые не переводятся в точную форму и находятся как бы "не в фокусе"; по-видимому, это свидетельствует о фундаментальных различиях между этими функциями и теми процессами, посредством которых они моделируются в терминах автоматов. Причина такого различия заключается в том, что ЭЦВМ, на которых реализуются соответствующие модели, оперируют бинарными кодами. Вследствие этого всякая функция, которую машина может реализовать... должна на каждой стадии удовлетворять принципу "все или ничего", то есть быть в достаточной степени конкретной и четкой, с тем чтобы на все связанные с ней вопросы можно было ответить "да" или "нет"» (The Modeling of Mind, p. * 21). Впрочем, Кроссон четко не определяет особенности и функции этой "внефокусной" формы восприятия, в результате чего остается неясным, можно ли в принципе, с его точки зрения, выразить в явной форме любое смутное содержание и что будет потеряно (и будет ли потеряно вообще) в модели, которая имеет дело только с четко выраженным материалом

47

глобальные, нежели те, о которых мы говорили выше; например, "развитие фигур", "контроль над центром", "выигрышная позиция", "слабый королевский фланг", "закрытая позиция"»* ,

Более того, они признают:

«Иногда в эксперименте де Гроота испытумый употреблял очень общие выражения, такие, как "для белых эта позиция выигрышна"; при этом невозможно было определить структуру или характеристику позиции, ведущую к этой оценке**.

Именно к таким выражениям прибегают Ньюэлл и Саймон, когда они не видят, как в терминах эвристически направляемого просчитывания процесса можно подойти к анализу того, каким образом возникает данная глобальная оценка. И вполне справедливо-но, по-видимому, не отдавая себе отчета в том, как это скажется на правдоподобии предсказаний Саймона,- они продолжают:

"На сегодняшний день работа над шахматными программами мало прибавила к нашему пониманию подобных понятий более высокого уровня"***.

Это типичный пример неопределенности высказываний Саймона и Ньюэлла. Что они имеют в виду? Что более совершенные статичные оценки, то есть более совершенные эвристики для выделения удовлетворительных ходов, позволят промоделировать явление фокусировки внимания? Их неослабевающая вера в возможность создания "машинного шахматиста", играющего на уровне мастера, приводит нас именно к такому толкованию. Однако предпринятый ими анализ игры мастера, основывающийся на работе де Гроота, мог бы послужить достаточным основанием для пессимизма, (Как мы видели, сам де Гроот говорит, что он не очень-то надеется на существенное улучшение эвристической шахматной программы.)



А. Ньюэлл и Г.Саймон замечают далее:

" В конце концов де Гроот нашел способ отличать сильных игроков от слабых с помощью теста на восприятие, заключающегося в воспроизведении по памяти шахматной позиции после предъявления ее на короткий

* A.Nеwell, H.Simon, An Example of Human Chess Play in the Light of Chess Playing Programs,-Carnegie Institute of Technology, 1964, August, p. 10-11.

** Ibid, p. 13 (курсив мой. -X.Д.).

*** Ibid., p. 11. Далее А.Ньюэлл и Г.Саймон пишут: "И вообще психология мало что может сказать о том, как глобальные понятия организуют поведение". Это, конечно, проявление крайней узости кругозора. Ведь гештальтпсихологи почти ни о чем больше и не говорят. Ньюэлл и Саймон же имеют в виду, что психология такого рода, с которой они предпочитают иметь дело, - то есть психология, использующая в качестве объясняющей модели программу для вычислительной машины, - не имеет доступа к подобным глобальным процессам.

48

промежуток времени (3-7 сек) . Гроссмейстер оказался в состоянии полностью воспроизвести позицию; по мере ухудшения качества игры шахматистов заметно ухудшались и их результаты в этой проверке Это привело де Гроота к выводу, что перцептивные способности и организация восприятия чрезвычайно существенны для очень хорошей игры1'*,

В статье, которую мы уже обсуждали, мастер по шахматам 3. Херст делает еще один шаг к выяснению сущности процесса восприятия и причин, по которым этот процесс не поддается программированию:

"Очевидно, мастер воспринимает расположение фигур на доске крупными блоками, такими, как пешечная структура и взаимодействия фигур... Если он все же делает ошибку, то это нередко объясняется тем, что он помещает какую-нибудь фигуру на определенное поле, стремясь создать выгодную для себя позицию"**.



Э. Херст резюмирует свою точку зрения следующим образом:

"В связи с множеством первичных ассоциаций, которыми располагает опытный игрок, он видит шахматную позицию не как конгломерат шахматных полей со стоящими на них деревянными фигурами, а как определенным способом организованную структуру (подобную образу, "гештальту" или целостной конфигурации, играющей столь существенную роль в гештальтпсихологии) "***.

Опираясь на эти высказывания, вернемся к анализу приведенного выше отчета шахматиста о своих рассуждениях. Мы можем сделать вывод, что знакомство нашего испытуемого с глобальными характеристиками шахматной игры и с предыдущими ходами данной конкретной партии дало ему возможность увидеть линии давления на противника, слабые и сильные стороны своей позиции и ее специфические особенности. Он видит, что позиция противника уязвима в таких-то пунктах (подобно тому как человек, имеющий представление о домах вообще и о некотором конкретном доме в частности, всегда воспринимает этот последний в неразрывной связи с той частью дома, которая расположена за его фасадом) и, фиксируй на этом внимание, обнаруживает незащищенную ладью. Этот шаг можно рассматривать как отдельную ступеньку в динамике восприятия структуры позиции.

Ни в одной из существующих шахматных программ не делается даже попытки использовать в этом плане опыт, накапливающийся в ходе игры. Наоборот, каждый ход ищется заново, как если бы это была отдельная шахматная задача из учебника. Программист вынужден считаться с таким положением дел, ибо в

* Ibid, p. 14.

** E.Hearst Psychology Across the Chessboard.-Psychology Today, 1967, June, p. 35, *** Ibid, p-37.

49

противном случае программа, обрастая информацией о прошлых положениях каждой фигуры, вскоре потонет в нарастающей массе данных. В действительности необходимо, чтобы программа отби­рала из накапливающейся информации о ходе игры именно то, что существенно и для выработки собственной стратегии, и для понимания стратегии противника. Но поскольку в существующих программах вообще не присутствует долгосрочная стратегия, остается единственный выход - порция за порцией накапливать и рассортировывать данные, хотя это требует очень больших затрат времени34. Без глобального рассмотрения - восприятия целостных образов или структур, по-видимому, невозможно избежать ситуации экспоненциального роста и преодолеть ограниченные возможности эвристик в выборе вариантов, подлежащих рассмотрению*.



Итак, глобальная форма "информационного процесса" (или "процесса переработки информации"), при которой информация рассматривается не в четкой форме, а остается, скорее, в периферийной сфере сознания и учитывается неявно, действует постоянно, непрерывно организуя наше эмпирическое познание. Поэтому нет оснований полагать, что обнаружение незащищенной ладьи является результатом осуществляемого испытуемым быстрого подсознательного просчета вариантов, продолжающегося до тех пор, пока наступит момент, когда последний переходит в область явного сознания. Более того, есть убедительные причины для того, чтобы отбросить это предположение, поскольку с ним связано больше вопросов, чем позитивных решений.

Если испытуемый подсознательно, пользуясь прекрасными эвристиками, просчитывает тысячи альтернатив для того, чтобы достичь момента, в который он фиксирует свое внимание на ладье, то почему этот подсознательный процесс не продолжается до конца, то есть вплоть до того момента, когда шахматисту вдруг приходит в голову, какой ход является наилучшим? Если, с одной стороны, подсознательное просчитывание столь быстро и точно, почему тогда в какой-то момент-а именно когда испытуемый замечает ладью - он обращается к обремени-

* М. Минский осознает эти трудности, однако сохраняет уверенность в том, что должно существовать какое-то их эвристическое решение: "Наверно, это можно произвести с помощью некоторого эвристического метода, который сделает возможным учет относящихся к делу факторов, или с помощью логики, позволяющей извлекать из них соответствующие следствия. В этом последнем случае неудобство заключается в том, что антецеденты есех утверждений должны содержать описание состояния данной системы, а для сложных систем оно становится слишком громоздким. Иные - регулярные систематические - решения проблемы, по-видимому, также неприемлемы. По всей вероятности, это одна из тех задач, которая настоятельно требует именно эвристического решения" (Semantic Information Processing, p. 422).

50

тельному методу медленного и трудного сознательного просчиты-вания? Если же, с другой стороны, подсознательного просчиты-вания недостаточно для адекватного решения задачи, то каковы преимущества переключения на осознанный вариант того же процесса?

Такого рода "телеологические" рассуждения сами по себе не могут служить доказательством недискретного характера функционирования подсознания. Тем не менее при таком подходе становится ясно, что бремя доказательства должно лечь на плечи тех, кто выдвигает предположение о дискретности подсознательных процессов или даже считает его обязательным. Нет никаких данных, ни поведенческих, ни интроспективных, свидетельствующих о том, что просчитывание является единственной формой "информационного процесса", используемого при игре в шахматы, и что "существо задачи - это поиск в пространстве возможностей, число которых растет по экспоненциальному закону"*. Скорее, наоборот, все протоколы экспериментов свидетельствуют о том, что при игре в шахматы используется два типа поведения:

фокусировка, фиксация внимания - путем глобальной организации поля восприятия - на области, ранее находившейся в периферийном сознании; в результате интерес к другим областям, все еще находящимся на периферии сознания, повышается; явное просчитывание альтернатив.

Такое разделение объясняет столь характерный для первых работ по моделированию процесса познания первоначальный успех и позднейшие неудачи. Во всех игровых программах быстрый успех был получен при программировании таких игр или таких частей игр, для которых применим метод эвристически направляемого просчитывания. Неудачи же начинаются там, где в силу большой сложности задачи становится необходимым глобальное восприятие образов, с тем чтобы избежать непомерного экспоненциального роста числа возможностей, подлежащих просчету.



Бесконтекстная точность или допустимая неоднозначность?

В программировании игр отчетливо проявилась необходимость обработки "информации", не рассматриваемой в явном виде, но и не исключаемой из рассмотрения, то есть информации,

* А. Ньюэлл, Дж. Шоу, Г. Саймон. Программа для игры в шахматы и проблема сложности. - В кн.: Вычислительные машины и мышление, с. 65.

51

находящейся на периферии сознания. Приостановка работ по машинному переводу была связана со второй непрограммируемой формой "обработки информации": умением человека учитывать нечеткие ситуации, не прибегая к замене их точными описаниями.

Мы видели, что И.Бар-Хиллел и А.Эттингер - одни из самых уважаемых и знающих исследователей в области автоматического перевода - сошлись в своих пессимистических оценках возможности дальнейшего прогресса в этом направлении. Оба они пришли к выводу, что, для того чтобы переводить с одного естественного языка на другой, требуется нечто большее, чем машинный словарь {каким бы полным он ни был) и правила грамматики (сколь совершенными они ни оказались бы). Порядок слов в предложении не дает машине достаточной информации для того, чтобы решить, какой из возможных грамматических разборов данного предложения наиболее приемлем в соответствующем случае, а стоящие рядом слова (письменный контекст) не всегда дают возможность определить, какое из нескольких допустимых значений данного слова имел в виду автор.

Рассматривая различные системы синтаксического анализа предложений, допустимых в данной грамматике, Эттингер говорит:

"К настоящему времени опыт такого анализа показал, что как в русском, так и в английском языках степень допустимой синтаксической неоднозначности гораздо выше, чем это предполагалось ранее. В этой связи, а также в связи с относительной нечеткостью границ между грамматически правильным и неправильным предложениями возникает серьезный вопрос о принципиальной возможности создания системы эффективной, полностью автоматизированной обработки русского или английского текста, пригодной для любых целей перевода или обмена информацией"*.



Работа А. Эттингера над машинным словарем была на первых порах успешной; позднее он вместе с Куно и другими работал над системами синтаксического анализа. Тем не менее он не берет на себя смелость утверждать, что туман, окутывающий процессы понимания естественного языка, начинает рассеиваться, оставляя неясными лишь некоторые наиболее трудные проблемы. Скорее наоборот, Эттингер обращает внимание на "чрезвычайно загадочные семантические процессы, благодаря которым большинство людей в своих рассуждениях интерпретируют большинство осмысленных предложений в большинстве случаев однозначно"**

Здесь мы видим еще один пример важности краевого сознания. Не вызывает сомнения, что человек, владеющий естественным языком, не осознает всех тех смутных мотивов, неявных

52

ориентиров, которые помогают ему в решении вопроса о синтаксической структуре и смысле высказывания. В то же время ничто не указывает на подсознательное использование этих скрытых ориентиров. И действительно, имеется два соображения, которые исключают возможность учета этих скрытых ориентиров в какой-либо последовательно или даже параллельно работающей программе*.

Во-первых, это доводы И. Бар-Хиллела (в гл. 6 мы разберем их более подробно), указывающего на то, что таких смутных, ориентиров может быть бесконечно много. Во-вторых, даже если бы число таких неявных факторов не превосходило некоторых разумных пределов, это бы нас все равно не спасло, так как для того, чтобы составить программу, использующую эти факторы для определения значения словосочетания, нам пришлось бы сформулировать некоторые синтаксические и семантические критерии в виде строгих правил; а ведь при пользовании языком мы не опираемся на строгие правила и это не приводит к неясностям. Еще Б.Паскаль писал о том, что разум в процессе восприятия функционирует втихомолку, "про себя", естественно и не по правилам технического характера. Эту глубокую идею в применении к языку тщательно исследовал Л.Витгенштейн:

"Мы не в состоянии точно описать понятия, которыми мы пользуемся, не потому, что не знаем их реальных определений, а потому, что таких "реальных определений" не существует. Предположение, что они непременно должны существовать, равносильно предположению, что всякий раз, когда дети играют в мячик, они играют в какую-то игру со строгими правилами"**.

Естественным языком люди пользуются в ситуациях, в которых они преследуют те или иные цели. Эти внелингвистические

* При последовательной переработке информации программа задает последовательность операций, в которой каждая операция зависит от результатов выполнении предыдущих. При параллельной переработке одновременно производится несколько таких последовательных вычислений. Параллельная переработка может быть промоделирована последовательной программой; однако между этими двумя случаями имеется важное логическое различие: если программа носит последовательный характер, то каждый шаг определяемых ею вычислений зависит от предыдущих шагов; если же программа параллельна, то операции, входящие в каждую последовательность, не зависят от операций, выполняемых в других последовательностях,



** L. Wittgenstein. The Blue and Brown Books, Oxford, Eng., B, BTackwell, 1960, p. 25. (M. Кochen, D.M.MacKay, M.E.Maron, M.Scriven, L. Uhr. Computers and Comprehension, The RAND Corporation, RM-4065-PR, April 1964, p. 12.) Участники симпозиума "Вычислительные машины и процессы понимания", проведенного корпорацией RAND, высказывали предположения о преимуществах и психологической обоснованности такого "нерегулярного" характера естественного языка. "Все определяется тем фактом, что язык представляет собой комбинаторный набор вариантов с неограниченным числом возможных комбинаций, значение которых может быть выведено из конечного множества "правил", управляющих значениями компонент. (Так называемые "правила" вырабатываются при

53

цели, сами по себе не предполагающие ни точной формулировки, ни даже ее возможности, и определяют для человека те скрытые ориентиры, которые служат ограничению неоднозначности высказываний, причем настолько, насколько это необходимо для решения соответствующей задачи. Фраза типа "Держись ко мне поближе" может означать все что угодно, начиная от "Держись рядом со мной" и кончая "Находись от меня на расстоянии километра"- в зависимости от того, обращаются ли с ней к ребенку на многолюдной улице или к товарищу-космонавту во время экспедиции на Луне. Эта фраза никогда не имеет совершенно однозначного смысла, одинакового во всех ситуациях, что, впрочем, вполне разумно; но ее значение в каждой конкретной ситуации всегда может быть сделано достаточно определенным для того, чтобы можно было достичь желаемого результата.

Наша способность использовать глобальный контекст для требуемого уменьшения неоднозначности, не прибегая при этом к формализации (то есть к полному исключению неопределенности), выявляет вторую фундаментальную форму "переработки информации" человеком, которая вытекает из первой. Периферийное, краевое сознание учитывает неявные ориентиры, заключенные в контексте, а также, вероятно, некоторые возможные грамматические конструкции и смысл, значение- все то, что на выходе машины должно быть сформулировано в четкой форме. Присущее человеку ощущение ситуации позволяет ему исключать из рассмотрения большинство возможных вариантов до всякого точного их анализа. Будем называть эту способность сужать спектр возможных значений в соответствии с ситуацией "допустимой неоднозначностью".

Высказывание и понимание предложения естественного языка предполагают имплицитное знание того, как предложение зависит от контекста. Поэтому, как и предполагал Тьюринг, единственный способ заставить ЭЦВМ понимать и переводить естественный язык - это, по всей видимости, составить программу, которая даст машине возможность познавать мир. "Я не допускаю возможности,- говорит И. Бар-Хиллел,- что машины, программы которых не позволяют им обучаться в подлинном смысле этого слова, смогут когда-либо надежно осуществлять высококачественный перевод"*. Признавая время от времени, что применение существующих методов наталкивается на известные трудности, энтузиасты "искусственного интеллекта" в качестве панацеи пред-

обучении в виде наборов ответных реакций, и они лишь частично поддаются формализации.)"

* Y.Bar-Hillеl. The Present Status of Automatic Translation of Language, -In: Advances in Computers, p. 105-106.

54



лагают прибегнуть к обучению. С. Пейперт, проводящий исследования в Массачусетсом технологическом институте, например, недавно заявил, что нельзя ожидать от машины действий, подобных поведению взрослого человека, если машина не прошла предварительного обучения, и что задача сводится к тому, чтобы создать ЭЦВМ, обладающую той же способностью к обучению, что и ребенок. Однако такой подход, как мы увидим ниже, только уводит нас от рассматриваемой проблемы.

В области обучения языку единственной интересной и удачной программой была программа Э. Фейгенбаума ЕРАМ («Elementary Preceiver and Memorizer» - "Система элементарного воприятия и запоминания"). ЕРАМ моделирует процесс обучения ассоциациям бессмысленных слогов, который Э.Фейгенбаум называет упрощенным вариантом вербального обучения*. Однако обучение бессмысленным слогам вообще не является обучением языку. Обучение ассоциациям бессмысленных слогов фактически есть не что иное, как приобретение своего рода условного рефлекса в смысле И.П. Павлова. Экспериментатор последовательно предъявляет испытуемому карточки с надписями DAX и JIR; но он мог бы с тем же успехом включать сначала красную, а потом зеленую лампочки. После достаточного числа этих последовательных экспозиций испытуемый научается предугадывать второй элемент пары. В эксперименте такого рода субъекту отводится абсолютно пассивная роль, В некотором смысле он ничему не обучается - просто с ним что-то проделывают. Кем бы ни был испытуемый - слабоумным, ребенком, взрослым человеком,- эффект обучения бессмысленным слогам будет совершенно одним и тем же. В конце XIX в. такая форма выработки условной связи была предложена Г.Эбингаузом специально для того, чтобы исключить какое бы то ни было влияние уже сложившихся ассоциаций на процесс осмысленного разбиения на классы или обращения к контексту.

Неудивительно поэтому, что в таких случаях отчеты испытуемых и машинный результат почти точно соответствуют друг другу. Однако это весьма сомнительный успех, ибо единственный случай удачного моделирования познания имитирует процесс, в котором отсутствует понимание и который поэтому нельзя считать познавательным.

Обучение языку является значительно более сложным и загадочным процессом, нежели тот род условного рефлекса, который лежит в основе научения ассоциациям бессмысленных слогов. Для того чтобы объяснить человеку значение какого-либо

* См.: Э. Фейгенбаум. Моделирование вербального поведения. - В кн.: Вычислительные машины и мышление, с. 302-316.

55



нового слова, иногда достаточно просто указать пальцем на обозначаемый этим словом предмет. Блаженный Августин в своей "Исповеди" и А.Тьюринг в своей статье о "машинном интеллекте" полагают, что именно таким способом мы обучаем детей языку. Однако Л.Витгенштейн замечает, что просто указав пальцем, например, на стол и сказав слово "коричневый", мы тем самым еще не дадим знать ребенку, что именно имеется в виду:. цвет, размер или форма стола, тип объекта или его собственное имя. Если же ребенок уже владеет языком, то ему можно сказать, что имеется в виду именно цвет. Ну, а с чего начать, если ребенок еще совсем не понимает языка? Витгенштейн считает, что для этого ребенок должен быть погружен в своего рода "жизненную среду", в которой он разделяет по крайней мере некоторые из целей и интересов своего учителя; при этом каждодневная деятельность ребенка помогает ему устанавливать соответствия между употребляемыми словами и тем, что они обозначают.

Коль скоро это так, то чему же можно научить машину? Именно этот вопрос ставится в одной из немногих серьезных и критически окрашенных работ, вышедших из-под пера исследователей "искусственного интеллекта", . Э.Сэмюэль, составивший известную шашечную программу, утверждает, что машина не может считаться разумной, поскольку она в состоянии делать только то, что ей предписано программой. М.Минский не принимает этого положения, ибо, по его мнению, достижения наших машин могут оказаться неожиданными для нас самих. Сэмюэль, как никто иной, знает об этом, поскольку его собственная шашечная программа его обыграла. Скорее всего, он имеет в виду другое: только запрограммировав машину соответствующим образом, можно вложить в нее способность выигрывать; программирование же в корне отличается от процесса обучения ребенка игре в шашки. Доводы Сэмюэля отклоняются М. Скрайвеном, который утверждает, что новые стратегии «"закладываются" программистом в вычислительную машину... точно в том же метафорическом смысле, в каком мы говорим о "закладывании" в ребенка необходимые для его дальнейшей жизни знаний»*. Однако Сэмюэлю, устоявшему против давления со стороны своих коллег, не следует поддаваться наступлению философов. Информация действительно "закладывается" в машину, но способом, совершенно отличным от процесса обучения детей. Мы только что видели, что этому процессу не дано и, как мы увидим в гл. 6, не может быть дано точное определение. Наши попытки объяснить обучаемому какое-либо выражение всегда происходят в определенном контексте, помогающем усвоить или уточнить его смысл. Обучение в

* М. Scriven. Primary Philosophy. New York, McGraw-Hill 1966 p. 186.

56

отличие от запоминания и заучивания с необходимостью предполагает своего рода оценивание. Вот что пишет по этому поводу Л. Витгенштейн:

"Может ли кто-нибудь быть учителем в этом процессе? Конечно. Время от времени он дает ученику нужный намек... Именно в этом заключаются преподавание и обучение в данном случае... На этом уровне человек усваивает не какой-то технический навык, а учится верному взгляду на вещи. Правила здесь также существуют, но они не образуют системы и применять их надлежащим образом могут только опытные люди; как это не похоже на правила, по которым производятся вычисления!"*

Вот эта-то способность улавливать смысл в конкретном контексте и характеризует настоящее обучение; как только дети начинают с этим справляться, они постоянно удивляют нас, преподнося нам сюрприз за сюрпризом.

Из всего сказанного относительно существенной роли контекста и неоднозначности в процессе использования естественного языка становится понятным, почему работа в области машинного перевода приостановилась на этапе создания машинного словаря. Как мы видели, способность научения языку предполагает ту же сложную комбинацию сугубо человеческих форм "процесса переработки информации", которая необходима для его понимания. Вопрос о том, как с помощью научения обойти трудности, с которыми неизбежно сталкивается эта область исследований, остается открытым.



Метод проб и ошибок или отделение существенного от несущественного?

В моделировании решения задач также встречаются два типа функционирования мышления: один, элементарный и допускающий разложение на составные части, объясняет удачное начало исследований в данной области; другой, более сложный и включающий в себя феномен "инсайта", оказался недоступным для "пошаговых" программ типа программы "Общего решателя задач" Саймона. При решении элементарных задач наиболее эффективен простой перебор всех возможных комбинаций, продолжающийся до тех пор, пока не подвернется нужное решение. Такой поиск с помощью метода проб и ошибок являет собой еще один пример "силового приема" типа сплошного просчитывания в шахматах. Но как и при моделировании игр, возможности

* L. Wittgenstein. Philosophical Investigations. Oxford, Eng, D- Black-well, 1953, p. 227. Здесь Л. Витгенштейн имеет в виду приобретение способности судить о проявлениях чувств, однако его утверждение имеет и более общий смысл.

57

машины и здесь вскоре оказываются исчерпанными. При моделировании решения задач необходимо найти какой-то систематический метод сужения зоны поиска, который не позволял бы тратить время на проверку неперспективных альтернатив. Именно на этом этапе в человеческом мышлении начинает действовать механизм "инсайта" - "озарения", интуиции, в то время как математики-программисты впадают в глубокое уныние.

Допустим, что задача сформулирована просто, то есть совершенно детерминистским образом, так что нам известна исходная ситуация, мы представляем себе искомое заключительное состояние и располагаем набором простых, специально заданных операторов для перехода от одного состояния к другому (иными словами, пусть мы имеем дело с тем, что Саймон назвал "простой формальной задачей"). Тогда созданный Саймоном "Общий решатель задач", произведя перебор значительного числа возможностей, будет сближать "начало" и "конец" до тех пор, пока задача не окажется решенной. Мы имеем, таким образом, удачный вариант применения анализа в терминах "средств и целей". Но даже в таком простом случае возникает масса трудностей. Если сравнить этапы машинного решения задачи на основе программы GPS, выданные на печать, с записью словесного отчета испытуемого о том, как он решал ту же самую задачу, то мы обнаружим, что ЭВМ совершала шаги (формальный поиск), которым нет соответствия в протоколе эксперимента. Как же объясняет Саймон факт отсутствия в отчете испытуемого этих шагов? С методологической точки зрения весьма сомнительно: "многое, связанное с задачей, не было высказано субъектом в явном виде (или даже не было им осознано)"*. Еще более необоснованным выглядит предположение Саймона о том, что эти невербализованные операции столь же элементарны, как и те, которые нашли явное выражение в протоколе опыта. А между тем некоторые подробности, упомянутые в работе Ньюэлла и Саймона "GPS - программа, моделирующая процесс человеческого мышления", наводят на мысль о том, что эти глубоко упрятанные операции вообще не имеют ничего общего с операциями, производимыми машиной согласно программе GPS.

В одном из экспериментов Саймона испытуемым предлагались задачи, относящиеся к формальной логике; при этом испытуемых снабжали перечнем правил преобразования символических выражений; их просили устно комментировать каждый шаг поиска решения. Не будем излагать правил преобразования; для нас существенно другое; в определенном месте протокола субъект говорит, что он применяет правило (А- В D А) и правило

* А. Ньюэлл и Г. Саймон. GPS - программа, моделирующая процесс человеческого мышления. - В кн.; Вычислительные машины и мышление, с. 295.

58



(А-ВЭВ) к конъюнкции ( IRVHPt-(RVQ). По этому поводу Ньюэлл и Саймон замечают:

" Субъект использовал обе формы правила 8 совместно, по крайней мере если судить по его рассуждениям, GPS же рассматривает каждую форму правила 8 отдельным пунктом. Возможно, что субъект действует так бессознательно и просто выдает два результата одновременно"*.

Не менее вероятно, однако, что испытуемый уловил симметричность конъюнкции относительно преобразования, производи-мого данным правилом, и действительно применил сразу обе его формы. Даже сами Ньюэлл и Саймон признают, что было бы предпочтительнее, если бы GPS применила обе формы правила в одном пункте. Только в этом случае их программа могла бы послужить основой для создания психологической теории, описывающей этапы рассуждений испытуемого. Однако они благоразумно воздерживаются от попыток составить программу, которая могла бы определять, в каких случаях следует применять обе формы правила сразу, а в каких - нет. Составление такой программы (что отнюдь не устранило бы описанного выше несоответствия машинного и человеческого подходов) потребовало бы дополнительных сведений о действиях субъекта - сведений, не нашедших отражения в протоколе эксперимента,- и тем самым привело бы к увеличению расхождений между отчетом испытуемого и программой. Таким образом, будучи не в состоянии избежать этих расхождений и не пытаясь даже понять их смысл, Ньюэлл и Саймон просто отмахиваются от них, считая, что имеют здесь дело с "примером параллельно протекающих процессов"**.

Однако в другом приводимом Ньюэллом и Саймоном случае расхождений уже нельзя отделаться такой оговоркой. Так, в одном из протоколов мы читаем: "Собственно говоря, мне следовало бы применить правило 6 лишь к левой части уравнения. Итак, надо применить правило 6, но только к левой части". Саймон пишет:

"Здесь есть сильное расхождение со схемой действий GPS... И субъект и GPS нашли, что именно правило 6 подходит для изменения знаков. Здесь GPS просто применила правило к текущему выражению, в то время как испытуемый вернулся назад и исправил предшествующее применение. В программе мы не найдем чего-либо, что соответствовало бы этому

* Там же, с. 296.

** См. там же, с. 297. Произвольный характер этого объяснения ad hoc ясен из контекста. Более того, отвечая на соответствующий вопрос во время своей Мэллоновской лекции в Массачусетсом технологическом институте s 1968 г., Саймон сказал по этому поводу, что, по его мнению, параллельно протекающие процессы не играют никакой роли в познании и что, насколько он помнит, он никогда этого не утверждал»

59

действию. Наиболее непосредственное объяснение состоит в том, что применение правила 6 в обратном направлении рассматривается субъектом как уничтожение правила 6, примененного ранее"*.



И действительно, это объяснение напрашивается прежде всего, однако Ньюэлл и Саймон, по-видимому, не осознают, что этот отход от схемы действий машины, не объяснимый ссылкой на параллельно протекающие процессы, чреват для их теории таким же крушением, которое потерпела теория Птолемея, когда обнаружилось, что действительные траектории планет ей не соответствуют. Все дело в том, что здесь имеет место какая-то иная форма мышления, отличная от простого поиска!

Ньюэлл и Саймон понимают суть проблемы, ибо замечают: "Здесь речь идет о механизме (а может быть, и о целом комплексе механизмов), который отсутствует у GPS"**. Но, подобно древним астрономам, они пытаются спасти свою теорию, добавляя к ней пару-другую эпициклов. Они по-прежнему полагают-без достаточных на то оснований, -что в основе подобного механизма лежат просто более изощренные методы поиска и что если дать GPS возможность "постоянно немного оглядываться назад, на свои предыдущие действия"***, то все будет в порядке. Ньюэлл и Саймон не отдают себе отчета в том, что, представляя разумное поведение как результат применения эвристических правил, они вынуждены принять малоправдоподобную точку зрения, согласно которой намерение субъекта провести анализ предшествующей части решения должно быть результатом в высшей степени избирательной процедуры проверки. В противном случае возникнет необходимость на каждом этапе решения проверять все предыдущие шаги, что безнадежно утяжелит программу.

С научной точки зрения более продуктивным было бы произвести дальнейший анализ тех пяти случаев расхождений, о которых говорится в статье Ньюэлла и Саймона, с тем чтобы определить, не используется ли в данном случае человеком какая-либо другая форма "информационных процессов". Так, гештальтпсихолог М.Вертгеймер в своей классической работе "Продуктивное мышление" отмечает, что представление о решении задач как о последовательности проб и ошибок исключает из рассмотрения важнейший аспект процесса решения задач, а именно то "схватывание" ее существенной структуры, которое он называет "инсайтом"****. При выполнении этой операции человек отвлекается от поверхности задачи и видит ее основу - то что М.Вертгеймер

* Там же, с. 298-299. **Там же, с. 300,

*** Там же.

**** M.Wertheimer. Productive Thinking, New York, Harper and Bros., 1945, p. 202.

60

называет "глубинной структурой"; именно она дает ему возможность организовать необходимые для отыскания решения шаги. Может показаться, что эта гештальтистская концепция в корне противоречит операционистским воззрениям сторонников "искусственного интеллекта", однако М. Минский, правда в других выражениях, делает следующее признание:

"Способность решения трудной задачи зависит от умения либо разделить ее на несколько подзадач меньшей трудности, либо преобразовать ее в менее сложную задачу. Для того чтобы не делать этого наугад, требуется некоторое понимание ситуации. Человек должен уметь логически обосновать или просто догадаться о последствиях той или иной формулировки задачи, с тем чтобы суметь построить более простые модели проблемной ситуации. Эти модели должны иметь достаточно богатую структуру; тогда, по всей вероятности, найденные для них решения удастся расширить до решения исходной задачи"*.



Поскольку при решении сложных задач человек, как правило, прибегает к помощи "инсайта" - интуиции - и поскольку то, о чем говорит М.Минский, никогда не было доведено до уровня программы, нет ничего удивительного в том, что в работе Ньюэлла и Саймона такого рода интуитивная перестройка структуры задачи тайком производится самими программистами. В работе "Процесс творческого мышления" Ньюэлл, Шоу и Саймон для объяснения тех характеристик отчета испытуемого, которые не укладываются в рамки простого анализа в терминах "средств и целей", вводят так называемые проектирующие эвристики ("эвристики планирования").

"Мы разработали программу... описывающую метод, с помощью которого некоторые испытуемые решают логические задачи исчисления О. Мура. Чтобы объяснить, в чем состоит введенное нами понятие "планирования", проще всего, пожалуй, описать эту программу. Исходя из чисто практических соображений, все двенадцать операторов, входящих в эту логическую систему, можно разбить на два класса; операторы одного из них мы будем называть "существенными", второго - "несущественными". Будем считать оператор существенным, если его применение к выражению "сильно" изменит вид этого выражения (примером может служить переход от PVP к Р). Несущественные операторы "слабо" меняют выражение (таков, например, переход от PVQиQVP).Kaк мы уже сказали, различие между существенными и несущественными операторами носит чисто прагматический характер. Из двенадцати операторов рассматриваемого исчисления восемь мы отнесли к классу существенных, а четыре - к классу несущественных...

Далее, если нам дано некоторое выражение, то мы можем выделить из него только такие характеристики, которые связаны с существенными изменениями. Например, из выражения PVQ мы можем получить выражение (PG), в котором порядок следования символов можно не принимать во внимание. Очевидно, если к полученному выражению применить несу-

* М.Мinsky. Descriptive Languages and Problem Solving,- In: Semantic Information Processing, p. 421

61

щественный оператор, то оно не изменится, в то время как применение существенного оператора может привести к его изменению.

Теперь мы можем установить некоторое соответствие между исходными выражениями и операторами, с одной стороны, и производными выражениями и существенными операторами - с другой. При этом исходной задаче преобразования выражения а в выражение b будет соответствовать новая задача - задача преобразования выражения b' в выражении b (где а' и b'извлекаются из выражений а и b соответственно). Предположим теперь, что мы решили эту новую задачу и что последовательность выражений, ведущая к решению, есть а', с', d',... b' . Тогда мы можем вернуться к исходной постановке проблемы и заняться решением новых задач - преобразованием выражения а в с, с в d и т. д. Таким образом, решение задачи в пространстве проектирования дает нам некоторый план решения исходной задачи"*.

Комментарии, как говорится, излишни. Остается только подчеркнуть, что описание самой программы начинается с параграфа 2. Классификация операторов на существенные и несущественные, то есть та операция, которую Вертгеймер называет "нахождением глубинной структуры" или "инсайтом", выполняется программистами еще до начала самого программирования.

Подобная "ловкость рук" прошла незамеченной для Дж. Миллера, Е. Галантера и К. Прибрама, если судить по их книге "Планы и структура поведения" (1960), которая представляет собой попытку создания психологической теории, разработанной под влиянием работ А,Ньюэлла, Дж.Шоу и Г.Саймона. Дж.Миллер и др. для начала приводят слова Дж.Пойа, прекрасно отдающего себе отчет в том, какую важную роль играет интуиция в решении задач;



"В своей известной работе "Как решать задачу",.. Пойа различает... [следующие] фазы эвристических процессов.

Во-первых, мы должны понять задачу. Мы должны ясно представить то, что дано, в каких условиях это дано и то неизвестное, которое мы ищем.

Во-вторых, мы должны составить план, который приведет нас к решению и свяжет данное с неизвестным"**.

Затем Миллер, Галантер и Прибрам сводят к минимуму значение первой фазы; попросту говоря, они решают не обращать внимания на этот этап:

"Очевидно, что второй из этих этапов самый трудный. Первый этап, который мы уже описали в главе XI, сводится к созданию четкого образа ситуации, необходимого для того, чтобы найти способ решения этой задачи, Это, конечно, необходимо, но, обсуждая четко сформулированные задачи, мы принимаем, что это уже выполнено" **.

Тем не менее вся эта психологическая теория решения задач немногого будет стоить, если в машинную модель не удастся

* A.Newell, J.Shaw , H.Simоп. The Processes of Creative Think-jng35,~The RAND Corporation, P-132GH 1958, September 16, p. 43-44.



** Дж. Миллер, Е. Галантер и К, Прибрам. Планы и структура поведении 36. М., 1965, с. 197. *** Там же.

62

ввести этот первый этап. Поэтому нет ничего удивительного в том, что где-то страниц через десять, принимая и оправдывая анализ в терминах "средств и целей" Саймона, Миллер и его соавторы с облегчением ссылаются на "метод планирования"* Саймона, по-видимому, имея в виду те самые абзацы, которые мы только что обсуждали:

"Вторая общая система эвристической логики, использованная Ньюэллом, Шоу и Саймоном, состоит в пренебрежении рядом деталей задачи. Обычно это упрощает задачу, и эта упрощенная задача может быть решена с помощью знакомого нам плана. План, используемый для решения простых задач, затем применяется как стратегия при решении исходных сложных проблем. Например, при решении задач пропозиционального исчисления машина может игнорировать различия между логическими связями и порядок символов"**.

Но, как мы видели, не машина игнорирует эти решения, а сами Ньюэлл, Шоу и Саймон. Говорить в данном случае об эвристиках - значит просто вводить читателя в заблуждение, поскольку никому еще не удавалось сформулировать правила, по которым производится этот предварительный выбор, а также показать, что на этом требующем интуиции этапе человек вообще следует каким бы то ни было правилам. Таким образом, выясняется, что никакой машинноориентированной теории для этого фундаментального первого этапа решения задач, состоящего в разделении существенного и несущественного, не существует. Только исследователи, столь уверенные в собственной правоте, как Миллер и его соавторы, могли оставить без внимания тот факт, что "метод планирования" Саймона с его предварительной обработкой исходного материала не столько приводит к решению проблемы машинного моделирования, сколько ставит ее.

Именно способность человека отделять существенное от несущественного в каждой конкретной задаче объясняет наличие расхождений между отчетом испытуемого, решающего задачу, и результатом работы GPS. Мы уже указывали на то, что испытуемый применяет обе формы правила 8 вместе вследствие того, что уже на этой начальной стадии он осознает равноправие обоих членов конъюнкции. Аналогичным образом вследствие того, что он постиг существенную функцию, которая заключена в правиле 6, субъект в состоянии заметить, что повторное применение этого правила просто нейтрализует предыдущее применение. Как замечает М.Вертгеймер:

"Этот процесс (структурирования задачи.- Х.Д.) не исчерпывается рассмотрением данных ее частей и их преобразованиями. Он происходит на основе того материала, который по своей структуре адекватен задаче, но выбирается из прошлого опыта"***.

* Там же, с. 214.



** Там же, с. 209-210 (курсив мой.-

*** М. Wertheimеr. Productive Thinking, p. 195.

63

Поскольку игра есть одна из форм решения задач, вполне возможно, что этот процесс имеет место в шахматах. Как следует из цитаты Э. Херста, это действительно так.

"В результате своего исследования де Гроот приходит к выводу, что различия в силе игры в гораздо меньшей степени зависят от способности просчитывания, чем от умения "концептуально видеть задачу"- По всей вероятности, гроссмейстер превосходит мастера в умении выделять наиболее существенные особенности позиции, а не в общем числе ходов, которые он в состоянии рассмотреть. Несколько неожиданным для де Гроота оказался тот факт, что при выборе конкретного хода гроссмейстеры исследуют не больше возникающих при этом вариантов, чем более слабые игроки или мастера (в среднем от двух до четырех начальных ходов на позицию). Нельзя также сказать, что они просматривают эти варианты на большую глубину (обычно максимум на шесть-семь ходов вперед} -Гроссмейстер каким-то образом способен сразу "увидать" суть задачи, в то время как более слабый игрок постигает ее с трудом или вообще не постигает, даже если анализирует столько же вариантов и видит на столько же ходов вперед, что и гроссмейстер"*.

Как мы видели, М. Минский уже в 1961 г. ясно осознавал важность этих проблем. Единственное, на что он надеялся,- это на то, что удастся изобрести такую планирующую программу, в которой обычный эвристический поиск будет использоваться на более высоком уровне.

"Когда мы настаиваем на применении "рассуждения", мы ни в коей мере не предлагаем отказаться от нашего основного замысла и ввести некую интеллектуальную процедуру. Программа, управляющая поиском, будет не чем иным, как еще одной эвристической программой. Почти наверняка в нее будут входить в основном только объекты и процессы того же типа, что и в программы первого уровня"**.

Но такая планирующая программа со своей стороны потребовала бы разделения операторов на существенные и несущественные. Если сам программист не проведет на каком-то этапе такого разделения, то он будет вынужден бесконечно наращивать планирующие программы, так как для каждой из них потребуется программа более высокого уровня, чтобы формализовать соответствующую ей задачу с плохой структурой. Именно здесь, при переходе от простых форм "информационных процессов" к сложным. Минский делает обычный в таких случаях ход - вводит обучение.



" Проблема подбора способа дедукции полезных заключений из большого массива высказываний (то есть проблема соотнесения различных методов с различными типами задач) ставит новую задачу поиска. Логическое исследование должно проводиться только по тем данным, которые

* Е.Неаrst. Psychology Across the Chessboard,- Psychology Today, 1967, June, p. 32.

** M.Minsky,Descriptive Languages and Problem Solving.- In: Semantic Information Processing, p. 420.

64

вероятнее всего имеют отношение к текущей задаче. Малоправдоподобно, чтобы эта функция отбора была полностью задана с самого начала. Она должна совершенствоваться по мере накопления данных в ходе эксперимента"*.

Однако до сих пор никто даже не попытался гипотетически описать, каким образом машина могла бы осуществлять эту операцию отбора или как следует ее запрограммировать, чтобы она могла научиться этому, поскольку иначе никакое обучение на основе прошлого опыта невозможно.

Оценивая работы, выполненные после выхода в свет труда "Вычислительные машины и мышление", Э.Фейгенбаум отмечает бросающееся в глаза отсутствие обучающихся программ:

"До сих пор в области ИИ значение машинного обучения для решения проблем осознавалось весьма слабо. Единственную, по существу, за много лет заслуживающую упоминания работу представляет известная шашечная программа Сэмюэля и использованная в ней процедура обучения, (Большой интерес в свое время вызвала предложенная Ньюэллом, Шоу и Саймоном система обучения GPS , однако она осталась нереализованной.) Как это ни удивительно, и в наши дни ситуация остается прежней"**.



Такая задержка развития удивительна только для тех, кто, подобно Фейгенбауму, не осознает, что способность к различению существенного и несущественного является чисто человеческой формой "процесса переработки информации", необходимой для обучения и решения задач; она не воспроизводится методами машинного поиска, которые эффективны только после того, как такое разделение произведено. Именно эта функция интеллекта преграждает путь дальнейшему прогрессу в области решения задач.

Более того, представление, что проблема планирования может быть решена изолированно и что возможно разделение операторов на существенные и несущественные - наподобие готовых блоков, которые остается только рассортировать,- является представлением чисто иллюзорным, возникшим под влиянием искусственных- ad hoc- приемов решения задач и простых случаев (например, относящихся к области логики); легко поддаться искушению и уверовать в то, что те или иные операторы существенны или несущественны сами по себе. Возникает взгляд, что, поскольку операторы таковы, на нашу долю остается лишь установление эвристического правила для их сортировки. Однако обычно (нередко даже в логике) существенность операторов находится в зависимости от контекста прагматического характера,

* Ibid., p. 123.

** Э.Фейгенбаум. Искусственный интеллект: темы исследования во втором десятилетии развития. - Кибернетический сборник, Новая серия, вып. 10, М., 1973, с. 18437.

65

Ньюэлл, Шоу и Саймон откровенно признают, что они вынуждены прибегать к предварительной обработке исходного материала, использующей интуицию. В связи с этим у них, казалось бы, нет ни малейшего основания утверждать, что при решении задач человеком тот тип поведения, который не очень ясно называют сообразительностью, интуицией, проникающим в суть дела "озарением", в действительности является результатом рассудочного применения тех или иных эвристик, служащих для сужения пространства поиска решения. Наоборот, их работа с GPS показала, что до тех пор, пока не будет произведена предварительная структуризация задачи, всякий поиск усложнен настолько, что его и поиском-то не назовешь.

Шутки ради заметим, что исследования в области моделирования процессов познания сами являют прекрасный пример, так сказать, разумного поведения по программе GPS, когда она предоставлена самой себе. Здесь мы также сталкиваемся с чем-то вроде залатывания дыр и подшивания кусочков с помощью приемов ad hoc - поведением, характерным для человека, завороженного поверхностной структурой задачи; это своего рода карабканье на дерево в надежде добраться до Луны. Может быть, именно потому, что в "моделировании процесса познания" интуиция не в чести, некоторые исследователи в этой области ошибочно приняли поведение GPS за разумное.

Списочная организация признаков или осмысленная группировка объектов?



Вычислительная машина распознает любой образ только на основе заданного перечня специфических признаков. При этом возникает проблема экспоненциального роста,- проблема, которую человек способен обойти, потому что идет каким-то другим путем. Следовательно, при моделировании распознавания даже простых образов может потребоваться обращение ко всем рассмотренным нами выше основным формам "переработки информации" человеком. И если исследователям в области "искусственного интеллекта" удалось, используя машинные методы, добиться некоторых успехов в простых случаях, то такие сложные образования, как художественные стили или лица людей, обладающие весьма расплывчатыми чертами сходства и различия, по-видимому, требуют для их узнавания своеобразной комбинации процессов, происходящих на периферии сознания, феномена допустимой неоднозначности и "инсайта" - всего того, что недоступно цифровой вычислительной машине. Неудивительно поэтому, что работа по распознаванию образов довольно поздно началась и довольно быстро притормозилась.

66

В гл. 1 мы отметили, что слабая сторона существующих в настоящее время программ по распознаванию образов (за исключением, возможно, программы Л.Юра и Ч.Фосслера, возможности операторов которой - она распознает всего пять букв - еще недостаточно проверены) заключается в том, что они не в состоянии сами вырабатывать операторы выбора. Теперь, однако, мы покажем, что такая постановка вопроса основывается на предпосылках, таящих в себе более глубокие и более сложные проблемы.

"Инсайт", Первый признак, указывающий на то, что распознавание образов человеком и ЭЦВМ различается коренным образом, состоит в том, что человек (и животные) - в отличие от машины - справляется с изменениями в ориентации и размерах изображений, его неполнотой, искажениями, зашумленностью фона.

В пору возникновения направления "искусственного интеллекта" специалисты, разрабатывавшие программы распознавания, сначала старались нормализовать изображение, а потом проверяли, как оно идентифицируется с образами некоторого множества. Однако человек при распознавании объектов, по-видимому, пренебрегает изменениями их размеров и ориентации; пропусками в изображении фигур и т. п. Хотя некоторые константы восприятия действительно подвергаются определенной нормализации (кажущиеся размеры и яркость варьируют в меньшей степени, чем соответствующие изменения сигнала, достигающего сетчатки глаза), не вызывает сомнения, что мы не нуждаемся в полностью нормализованном и "сглаженном" изображении, поскольку, воспринимая изображение искаженным, неполным, большим или маленьким и т.д., мы можем в то же время узнать его.

В программах более позднего времени нормализации изображения нет - в них используются мощные операторы, выделяющие отличительные характеристики образов и в то же время нечувствительные к искажению и шумам. Однако маловероятно, чтобы в процессе распознавания человек применял такого рода искусственные приемы. Как выяснилось, в тех особых случаях, когда человек может выразить словами то, на что он обращает внимание, он пользуется не мощными операторами, которые позволяют справляться с размазанными изображениями и шумом, а скорее набором идеальных характеристик, к которым каждый конкретный распознаваемый объект может только приближаться. Мы узнаем искаженные образы не потому, что они попадают в рамки, определяемые более широким и более искусно заданным набором признаков, а вследствие того, что образы эти обладают теми же простыми свойствами, что и образы неискаженные,- вместе с некоторыми случайными чертами. Аналогичным образом мы не проверяем наличие шума, с тем чтобы потом его отбросить, а

67

просто игнорируем его, считая несущественным*. И здесь мы опять сталкиваемся со способностью человека к различению существенного и несущественного.

Периферийное сознание. Для того чтобы определить, с каким из множества уже проанализированных образов предъявляемый объект имеет наибольшее сходство, был предложен способ последовательной проверки наличия у него определенных признаков из некоторого их набора (метод дерева решения). Другой часто встречающийся метод (он реализован в программе О.Сэлфриджа "Пандемониум") состоит в использовании вероятностей присутствия признаков (из заданного их множества) - Оба эти метода с несомненностью предполагают, что человек, подобно механическому распознающему устройству, обязательно классифицирует образы в терминах четко заданного списка признаков. О.Сэлфридж и У.Ниссер не сомневаются в том, что "человек, выделяющий какой-либо образ из совокупности раздражителей, по существу, уже провел классификацию всех возможных входных сигналов"**. В обзоре работ по распознаванию образов И. Хант придерживается того же мнения: "Распознавание образов, так же как и формирование понятий, включает в себя научение правилам классификации"***.



Однако в тех случаях, когда образ хоть сколько-нибудь сложен и достаточно сходен с большим числом других образов - в результате чего для его распознавания требуется большое число признаков, -возникает угроза экспоненциального роста. Таким образом, предположение, что всякое распознающее устройство, будь то человек или машина, работает по аналитическому принципу, выделяет отдельные черты объекта, ведет к предположению, что должны существовать определенные критические признаки, которые делают распознавание осуществимым; все дело в том, чтобы их отыскать либо запрограммировать ЭЦВМ так, чтобы она сама их находила. Тем самым нас склоняют к поиску своего рода эвристик восприятия, "мощных" операторов, которых пока еще никому не удалось обнаружить. Как шахматист не в состоянии объяснить программистам, каким образом он

* Каковы бы ни были процессы переработки информации, которые осуществляет мозг человека для выделения образов, этому, несомненно, способствует организация рецепторов. Но даже если бы удалось так сконструировать рецептивный вход вычислительной машины, чтобы она осуществляла перцептивное выделение объекта (отделение фигуры от фона), то такого рода селективные рецепторы потребовали бы введения стадии аналоговой обработки информации, чего исследователи в области "искусственного интеллекта" стараются избегать.

** О. G.Selfridge, U. Nеisser. Pattern Recognition by Machine.-ln: Computers and Thought, p, 238.

*** E.Hunt. Computer Simulation: Artificial Intelligence Studies and Their Relevance to Psychology .-In: Annyal Review of Psychology, P.R.Farns-worth (ed.),vol. 19, Palo Alto (Calif.), 1968, p. 145.

68

находит кратчайший путь к решению, так и, как отмечают Сэлфридж и Ниссер, в случае распознавания образов "очень часто принцип классификации остается неизвестным даже (самому распознающему.-ХД)". Тем не менее Сэлфридж и Ниссер, подобно Ньюэллу и Саймону, исходят из предпосылки, что испытуемый подсознательно производит поиск в лабиринте -е данном случае просматривает список признаков. При этом они вынуждены заключить, что подобный принцип классификации "слишком сложен для точного описания"*.

Однако поиск, основанный на таком списке, чрезвычайно затруднителен, по крайней мере для человека - последний для принятия того или иного решения в состоянии исследовать последовательно (или параллельно) далеко не все релевантные признаки; многие признаки, определяющие исход распознавания, вообще никогда не рассматриваются в явном виде, но оказывают свое влияние, оставаясь на периферии сознания.

Если в шахматах мы начинаем с общего "чувства ситуации" и только на заключительном этапе анализа переходим к просчитыванию, то в процессе восприятия мы вообще никогда не обращаемся к каким бы то ни было четким признакам. Как правило, мы распознаем сходство предмета с другими предметами, не отдавая себе отчета в том, что он является примером предметов данного типа или элементом некоторого класса предметов, задаваемого набором специфических признаков. Анализируя различия между перцептивным и понятийным сознанием, А.Гурвич пишет:



" Воспринимаемые предметы являются нам вместе с задающими их родовыми характеристиками... Но - и это крайне важно - воспринимать объект некоторого рода - совсем не значит понимать, что этот предмет является представителем или частным случаем предметов того или иного типа"**,

Иногда, разумеется, можно выделить определяющие характеристики в явном виде;

((Первый шаг в становлении понятийного сознания состоит е акте расчленения предмета, воспринимаемого в его типичности. Образующие предмет родовые признаки, которые до этого имманентно в нем присутствовали и были слиты с предметом, теперь отделяются, освобождаются от него. Выраженные в явной форме, эти признаки могут восприниматься сами по себе..- В результате такого расчленения родовые признаки превращаются в объект генерализации. В этой своей новой сущности они противостоят тому предмету восприятия, от которого только что отделились и который теперь превратился в пример или частный случай,,. [Таким образом, неявные ориентиры.- Х.Д. ] могут быть выделены и превращены

* O.G.Selfridge, U.Neisser. Pattern Recognition by Machine.- In: Computers and Thought, p. 238.

** A.Gurwitsch. On the Conceptual Consciousness.-In: The Modeling of Mind, p, 203.

69

в объект [специфический признак, который мы осознаем. - Х.Д.] в то время как ранее они только способствовали образованию другого объекта [образа. - Х.Д. ], находясь, так сказать, на "немых ролях"*.

Это движение от перцептивного сознания к понятийному (говоря словами Паскаля, от перцептивного склада ума к математическому) не обязательно означает шаг вперед, А. Гельб и К.Голдштейн исследовали нескольких человек, страдающих афазией, которые утратили способность перцептивного распознавания. Для такого больного всякое распознавание превращается в задачу классификации. Подобно цифровой вычислительной машине, больному приходится обращаться к тестовым наборам признаков и поисковым процедурам. Некоторые из больных афазией могут узнать геометрическую фигуру, например треугольник, только проверяя соответствующие признаки, то есть подсчитав число ее сторон, после чего делается вывод: "Треугольник имеет три стороны. Следовательно, это треугольник"**. Такое понятийное, концептуальное распознавание требует много времени и очень неуклюже: жертвы подобного нарушения деятельности мозга абсолютно не приспособлены к повседневной жизни.



Очевидно, в распознавании образов переход от неявного перцептивного разбиения на группы к точной понятийной классификации- даже на завершающей стадии, как это имеет место в шахматах,- обычно невыгоден. Тот факт, что для того, чтобы распознать некоторый образ, нам не нужно концептуализировать признаки или четко формулировать свойства, присущие нескольким экземплярам данного объекта, указывает на отличие человеческих способов распознавания от машинных, при которых распознавание происходит только на явном концептуальном уровне, в терминах принадлежности предметов к определенным классам.

Уменьшение неоднозначности, основанное на учете контекста. В рассмотренных до сих пор случаях признаки, определяющие принадлежность элемента некоторому классу, могли всегда быть представлены, по крайней мере в принципе, в явной форме, хотя, как правило, для практического использования в распознавании они слишком многочисленны, В некоторых случаях, однако, формализация признаков невозможна даже в принципе. Для того чтобы разобраться в этом вопросе, мы должны сначала убедиться в несостоятельности мнения, разделяемого в равной степени как "традиционными" философами, так и исследователями в области "искусственного интеллекта", согласно которому распознавание образов всегда можно представить себе как своего рода класси-

* Ibid., р 204-205.

** М. Мerleau-Ponty. Phenomenology of Perception, London, R, and K.Paul, 1962, p. 128 ff.

70

фикацию. В этом слишком поспешном заключении объединяются без разбора три разных типа узнавания, ни один из которых не обладает теми характеристиками, которых требуют от него философы и цифровые вычислительные машины.

Во-первых, существует тип узнавания или распознавания, который А. Гурвич называет "родоотносящим". С помощью узнавания такого типа мы можем сказать, например, что данный предмет есть карандаш. Гурвич подчеркивает, что этот тип распознавания, хотя он и представлен в нечеткой форме, поддается уточнению в терминах списка признаков. Таким образом его, по-видимому, можно привести к виду, допускающему программирование. При этом, однако, Гурвич упускает из виду, что при распознавании такого типа отбор существенных признаков и использование некоторых из них в качестве основы узнавания определяются назначением, целью. Например, когда-то для человека, который хотел писать чернилами, было важно то, что гусиное перо, если его заточить, может быть пишущим инструментом. Однако после того, как появились металлические ручки, за ними сохранилось наименование перьев (но не карандашей), по-видимому в связи с тем, что для тех, кто стал ими пользоваться, решающим оказалось их свойство оставлять на бумаге знаки, которые нельзя стереть.

Из этого можно было бы сделать вывод, что свойство оставлять нестираемые знаки является определяющим критерием для того, чтобы считать предмет пером, в то время как форма пера есть, говоря словами Л.Витгенштейна, только "симптом" - "явление, относительно которого опыт показал нам, что оно тем или иным образом сочетается с данным явлением, выступающим в качестве определяющего критерия". Можно попытаться даже встроить это различие между симптомом и критерием в нашу программу. Однако, по мнению Л.Витгенштейна, это различие характеризуется тем, что не является данным раз и навсегда, а изменяется вместе с изменением наших целей и знаний.

"Если вас спросят, какое явление есть определяющий критерий, а какое - симптом, то практически вы почти всегда окажетесь не в состоянии ответить на этот вопрос - разве что возьмете ответ "с потолка". В одном случае, возможно, будет удобно при определении некоторого слова использовать в качестве критерия одно явление, однако в другом случае выяснится, что это же слово можно определить с помощью другого явления, которое в первом случае оказывается только симптомом. Врачи пользуются наименованиями заболеваний, не задумываясь над тем, какие явления следует считать определяющими критериями, а какие - симптомами, что совсем не обязательно ведет к прискорбному отсутствию ясности.



* L.Wittgenstein. The Blue and Brown Books, p. 25

71

И в самом деле, это один из путей, на котором наши понятия становятся критериями, открытыми для применения при распознавании образов человеком, приобретая гибкость, которой так не хватает вычислительной машине, использующей фиксированный набор существенных признаков.

Второй тип узнавания - это распознавание сходства. В узнавании этого типа, как и в феномене "ограничения"* при определении значений слов и предложений, решающую роль играет контекст. Благодаря контексту мы начинаем замечать те признаки сходства, которые впоследствии можем узнать в изолированном виде - как в случае фигур, допускающих двоякое толкование, таких, как утка-кролик Л.Витгенштейна; будучи окружена изображениями уток, она похожа на утку, а в окружении кроликов напоминает кролика. При других обстоятельствах контекст помогает нам обратить внимание на некоторые аспекты образа, как в знаменитом эксперименте В.И. Пудовкина38.

"Однажды Пудовкин сделал крупным планом снимок Мозжухина, выражение лица которого было абсолютно бесстрастным, а затем смонтировал три отрывка, в каждом из которых кадры с Мозжухиным шли после следующих кадров: в первом случае - тарелки с супом, во втором - молодой женщины, лежащей в гробу, и, наконец, ребенка, играющего с плюшевым мишкой. И что же получилось? Создалось полное впечатление, что в каждом из этих кадров Мозжухин смотрит соответственно на тарелку, на женщину и на ребенка: на суп он глядит задумчиво, на женщину - с выражением горя, а на ребенка - улыбаясь. Зрители были поражены разнообразием его выразительных средств, хотя so всех трех случаях был использован один и тот же кадр, о котором если и можно что-то сказать, так только то, что он на редкость невыразителен"

Вот поразительный пример того, как контекст определяет различие в восприятии определенного выражения лица в ситуации, когда никакие характеристики лица, воспроизводимого на экране, не могут объяснить этого различия. Нам могут возразить, что то выразительное, по мнению зрителей, лицо, которое они видели на экране, имело определенные черты - печальные глаза, например, или счастливую улыбку, которые и помогли зрителю узнать то или иное выражение. Но выражение части лица, например глаз человека, может зависеть от всего лица таким образом, что, если закрыть остальную часть лица, оно станет совсем иным.

* Разумеется, это выглядит как "сужение смысла" или "снятие неоднозначности" только в глазах тек, кто подходит к этому вопросу с позиций вычислительной машины. Ниже мы убедимся, что человек структурирует ситуацию в терминах взаимозависимых значений, так что все остальные возможные значения слова или предложения ему даже не нужно исключать из рассмотрения. Они просто у него не возникают.

** Цит. по: М.Меrleau-Ponty. Sense and Non-Sense. Evanston, M Northwestern University Press, 1964, p. 54.

72



Более того, то или иное выражение глаз может подчеркнуть определенный изгиб носа, который остался бы незаметен на другом лице; нос в свою очередь может превратить улыбку в кривую усмешку, изменив при этом выражение глаз. По замечанию Л.Витгенштейна, "человеческий рот улыбается только на человеческом лице"*. В подобных случаях черты, необходимые для распознавания сходства (бегающий взгляд, насмешливая улыбка и т. д.), даже когда они носят вполне определенный характер, нельзя изолировать, то есть рассматривать нейтрально, вне контекста. Более того, как и в случае уточнения лингвистического смысла, контекст - в нашем примере человеческое лицо - не только определяет существенные для распознавания признаки, но и в свою очередь определяется ими. Выражение лица нельзя вывести из совокупности признаков, оно есть просто соотнесенность глаз, рта и т.д., подобно мелодии, которая, будучи составлена из отдельных нот, сама же и придает им специфические значения. При рассмотрении сходства, основанного на соотношениях такого рода, понятие узнавания в терминах изолированных признаков бессодержательно.

Существует еще один тип сходства, при котором предметы, опознаваемые как принадлежащие одному и тому же классу, вообще не имеют каких-либо общих признаков - даже зависящих от контекста. В процессе изучения естественного языка Витгенштейн пришел к исследованию этого типа "неклассификационного" распознавания:

"Мы сталкиваемся с очень сложной сетью перекрывающих друг друга и пересекающихся сходств. Иногда эти сходства носят общий характер, иногда касаются лишь деталей.

Лучшим выражением такого рода сходств является "фамильное сходство"; моменты сходства, присущие членам одной семьи, такие, как осанка, черты лица, цвет глаз, походка, темперамент и т,д., пересекаются и перекрывают друг друга именно таким образом. ...Мы расширяем наше понятие... подобно тому как при прядении нити скручиваем между собой отдельные волокна пряжи"**.

Фамильное сходство отличается от сходства членов одного и того же класса следующими весьма существенными моментами. Классы могут быть заданы в терминах признаков, даже если они не содержат ни одного элемента, в то время как фамильное сходство распознается только в терминах действительных или воображаемых примеров***. Более того, в то время как принад-

* L. Wittgenstein. Phjlosophica! Investigations, p. 583.

** Ibid., p, 32.

*** Поскольку типичность в отличие от принадлежности к классу зависит от сравнений отдельных примеров, сходство, определяющее тип, должно быть достаточно конкретным. Так, можно говорить о типичном индейце, но не о типичном человеке.

73



лежность к классу есть отношение типа "все или ничего"*, фамильное сходство образует целый спектр признаков, от "типичных" до "нетипичных". Нетипичного члена семьи, например, можно узнать, выстроив в ряд всех членов семьи, начиная с типичного ее представителя и кончая данным нетипичным. Аналогичным образом некоторые понятия, например "изящный", "аляповатый", "вульгарный", невозможно определить в терминах необходимых и достаточных условий; единственный способ дать о них представление- это продемонстрировать типичные случаи. Поскольку подобное распознавание членства в "семье" происходит не с помощью перечня признаков, а путем восприятия данного элемента в терминах близости его к некоторой парадигме (типичному элементу), постольку оно дает нам пример еще одного типа "открытости" и гибкости.

Наконец, Витгенштейн идет еще дальше и утверждает, что в некоторых случаях распознавание может происходить при полном отсутствии общих признаков, даже перекрывающихся. Продолжая вышеприведенный отрывок, Витгенштейн говорит довольно туманно:

«Если кто-нибудь скажет: "Существует нечто общее для всех этих конструкций, а именно дизъюнкция всех их общих свойств", то п отвечу, что это просто игра слов. С тем же успехом можно сказать: "Нечто проходит через всю нить, а именно непрерывное переплетение составляющих ее волокон")*.

Возможно, что Витгенштейн говорит здесь о третьем типе распознавания, который он явно не отделяет от узнавания по сходству; мы могли бы назвать это распознаванием на основе подобия.

Витгенштейн в своей интерпретации, по-видимому, имеет в

* Интересная попытка перешагнуть через этот дискретный ("все или ничего") характер отношения принадлежности к классу была предпринята Л. Заде (см,, например, L. A. Zadeh. Fuzzy Sets.-"Information and Control". Vol. 8, 1965, № 3, June). Однако в работе Заде (самой по себе интересной) классы все еще определяются в терминах конкретных признаков, просто при определении отношения принадлежности к классу допускается различная степень этой принадлежности. "Расплывчатое множество есть класс объектов, степени принадлежности которых этому классу образуют континуум" (р. 338). Более того, в том смысле, в каком употребляет это понятие Заде, расплывчатость сама по себе является расплывчатым понятием. В своем понятии расплывчатости Заде сваливает в одну кучу пять различных аспектов распознавания образов, а именно, аспекты, относящиеся к нечеткости границ, к зависимости от контекста, цели, субъективной оценки и к фамильному сходству. В результате совершенно непонятно, какой же аспект распознавания поддается формализации при помощи понятия расплывчатости (и поддается ли вообще хоть один) 39.

** L. Wittgenstein. Philosophical Investigations, p. 32.

74



виду не просто необозримый характер соответствующей дизъюнкции, обусловленный тем, что в процессе распознавания используется очень много перекрывающих друг друга признаков, в силу чего ею нельзя оперировать. Последовательно продолжая ход его рассуждений, уместно заключить, что не только каждый из признаков, упоминаемых им при рассмотрении фамильного сходства - осанка, цвет глаз, походка и т. д.,- не совпадает полностью у любых двух членов семьи, но что сами эти признаки в свою очередь представляют собой сеть пересекающихся подобий. Продолжая ту же аналогию, можно сказать, что каждое волокно состоит из волокон, со всеми вытекающими отсюда последствиями. Таким образом, любые два члена семьи могут иметь фамильное сходство и в то же время не иметь никаких идентичных признаков. В анализе Витгенштейна подобие является исходным понятием, несводимым к списку или дизъюнкции идентичных по характеру, жестко определенных черт, как того требует "машинное мышление"*, .

Для тех, кто может опознать члена "семьи", не нужно умения перечислять какие бы то ни было точно совпадающие признаки, общие хотя бы для двух ее членов - не говоря уже о том, что нет основания полагать, что такие признаки вообще существуют. Действительно, формализация фамильного сходства в терминах точного подобия признаков привела бы к тому, что оно утратило бы свойство "открытости" для новых случаев,- свойство, которое составляет наиболее яркое проявление феномена узнавания этого типа. Независимо от уже построенного дизъюнктивного списка признаков в "семью" всегда можно ввести новый член, признаки которого будут подобны признакам других ее членов, но в то же время не совпадут точно с какими-либо признаками последних; и тем не менее в некоторых ситуациях этот член можно будет распознать как принадлежащий к той же "семье", что и остальные.

Этот сложный, но очень часто встречающийся тип распознавания использует особую комбинацию всех трех вышеописанных форм "переработки информации": периферийное сознание, "инсайт" и обращение к контексту. Начнем с того, что этот процесс протекает в скрытой форме. В нем используется информация, которая остается, так сказать, на краю сферы сознания. Для того чтобы понять, какую роль играет в нем интуиция, мы должны прежде всего выделить различии между "родоотносящим" и "типоотносящим" узнаванием, хотя у А. Гурвича оба эти понятия

* Этот анализ получил дальнейшую разработку у Р. Бамбру (R. Bambrough. Universal and Family Resemblances).

75

взаимозаменимы. Согласно Гурвичу, родоотносящее распознавание зависит от скрытых ориентиров, которые всегда можно представить в явной форме. Распознавание типоотносящее - в том смысле, в каком мы до сих пор использовали это понятие,- зависит от подобий, которые не могут быть объективированы. Следовательно, распознавание типичного в отличие от распознавания родового требует интуитивного упорядочения относительно некоторой парадигмы. Парадигма выполняет свои функции постольку, поскольку является самым отчетливым проявлением того, что, по существу, делает все элементы элементами именно данной группы. Наконец, распознавание в терминах близости к парадигме есть не что иное, как форма обращения к контексту.

Л.Витгенштейн отмечает, что "осмысленное представление - это именно такое понимание, которое заключается в улавливании связей"*. Следуя Витгенштейну, мы называли эту комбинацию периферийного сознания, "инсайта" и зависимости от контекста "осмысленным разбиением на группы - осмысленной группировкой". Эта форма процесса "переработки информации" человеком не менее важна, чем те три основные формы обработки информации, которые входят в нее как составные части.

Расположим в порядке возрастания трудности те условия, при которых человек в состоянии узнавать объекты.



1) Распознаваемый объект может быть повернут, неполон, искажен, сопровождаться шумами, помехами.

2)Признаки, необходимые для узнавания, могут быть столь "тонки и многочисленны", что даже если бы их и можно было формализовать, то все равно по мере добавления новых подлежащих узнаванию объектов с их признаками дерево поиска стало бы чрезвычайно громоздким.

3)Признаки могут зависеть как от внешнего, так и от внутреннего контекста, поэтому их бесконтекстная спецификация может оказаться невозможной.

4)Возможно отсутствие общих признаков при наличии "сложной сети перекрывающихся подобий", которая может служить для выделения все новых и новых вариаций.

Следовательно, всякая система, претендующая на адекватность человеческому распознаванию, должна быть в состоянии:

1)для данного конкретного объекта отличать существенные признаки от несущественных;

2)использовать неявные ориентиры, хранящиеся на периферия сознания;

3)учитывать контекст;



* Ibid, p. 49.

76

4) воспринимать индивидуальное как типичное, то есть определять отношение индивидуального к некоторой парадигме.

Поскольку распознавание образов даже умеренной сложности может потребовать использования всех четырех форм процесса "переработки информации" человеком, исследования в области машинного распознавания объектов не продвинулись дальше многотрудного узнавания простых изображений типа печатных букв разных шрифтов и цифр почтового кода. Но общепризнан­но, что до тех пор, пока не произойдет существенного сдвига в работах по распознаванию образов, невозможен дальнейший про­гресс в области моделирования игр, автоматического перевода и машинного решения задач.

Заключение

Итак, мы выяснили, что основная проблема, стоящая перед теми, кто пытается использовать ЭЦВМ для моделирования разумного поведения человека, заключается в необходимости представления каждой альтернативы в четкой форме. При моделировании игр экспоненциальный рост дерева альтернатив требует ограничения числа прослеживаемых путей; в сложных играх, таких, как шахматы, существующие в настоящее время программы не в состоянии выбирать наиболее многообещающие ходы. В проблематике решения задач вопрос упирается не только в то, как вести избирательный поиск по дереву явно заданных альтернатив, но и в то, как структурировать задачу, обеспечив тем самым возможность начала процесса поиска. В области автоматического перевода в связи с тончайшими нюансами, характерными для естественного языка, возникают неясности уже на уровне самих элементов, подлежащих обработке. В распознавании образов безнадежно переплетаются все три вышеупомянутые проблемы; кроме того, дело усложняется тем, что типичность и подобие, по-видимому, являются неотъемлемыми составляющими восприятия. Все эти трудности и явились причиной того, что через пять лет после начала работы над "моделированием процесса познания" в этой области наступило затишье40.

Ни одно из предсказаний Саймона не сбылось. Два первых предсказания, касающиеся умения машин играть в шахматы и доказывать математические теоремы, своим провалом поставили под сомнение и третье его предсказание, касающееся психологической теории поведения человека. Несмотря на доверчивость и рвение, с которыми психологи взялись за дело, за протекшие десять лет психологические теории в своем большинстве не приняли форму программ для вычислительных машин.

77

Вместо обещанных триумфов отчетливо проступил общий контур развития: удачное моделирование простых механических форм процесса переработки информации, связанные с этим радужные надежды и, наконец, их крушение при столкновении с более сложными формами поведения. Предсказания Саймона оказались просто еще одним примером явления, которое Бар-Хиллел назвал "обманчивостью первого удачного шага"*. Однако сам Саймон не пришел к такому отрезвляющему выводу. В своем последнем предсказании, сделанном в 1965 г., он заявил, что "не более чем через 20 лет машины смогут выполнять ту же работу, которая под силу человеку"**.



Часть II нашей книги посвящена обсуждению причин столь непоколебимого оптимизма. Но сначала мы должны провести анализ работ в области "искусственного интеллекта", пришедшего на смену выдохшемуся "моделированию процесса познания"41

* Работа Э.Тофлера "Грядущий шок" представляет собой блестящую вариацию на ту же тему "первого шага" (см. гл. 2, с. 76).

** H.S imon. The Shape of Automation for Men and Management- New York, Harper and Row, 1965, p. 96.

78

К главе 2


Содержание раздела







Forekc.ru
Рефераты, дипломы, курсовые, выпускные и квалификационные работы, диссертации, учебники, учебные пособия, лекции, методические пособия и рекомендации, программы и курсы обучения, публикации из профильных изданий