Между прочим, в этом году исполнилось 50 лет защите гарвардским докторантом Полом Вербосом диссертации, в которой был описан метод обучения нейронных сетей с обратным распространением ошибки. На мой взгляд (автора), именно тогда родилось то, что человечество благоговейно называет «искусственным интеллектом».
Метод Вербоса напоминает игру «холодно-горячо», но мне больше нравится другой мысленный эксперимент.
Предположим, что некий слепец хочет забросить мяч в корзину, не имея понятия, где эта корзина находится. Он бросает мяч в произвольном направлении и с произвольной силой, а его зрячий друг сообщает ему расстояние от точки падения мяча до цели (и больше ничего говорить не имеет права). В зависимости от того, уменьшается или увеличивается это расстояние, наш герой корректирует направление и силу броска. Скажем, если после поворота направо расстояние уменьшилось, то он продолжит поворачиваться направо, а если расстояние увеличилось, то он повернётся налево, и т.д. После большого количества бросков и коррекций, мяч попадёт-таки в корзину.
Таким образом, на вход системы подаются два числовых параметра: направление и сила броска. На выходе получаем логическую переменную, имеющую два значения: «true» или «false», т.е. «попал» или «промазал». Подбор комбинации входных параметров, дающих на выходе «true», и есть то самое обучение с обратным распространением ошибки, за которое Полу Вербосу дали докторскую степень.
Кстати, даже на этом простом примере можно увидеть типичную проблему метода: локальные оптимумы. Например, брошенный в неверном направлении мяч может попасть в столб и, отскочив от него, шмякнуться рядом с целью, в результате чего слепец начнёт лупить мячом исключительно по столбу, потому что любое небольшое отклонение от столба (а отклонения всегда небольшие, таковы правила) приведёт к улёту мяча ещё дальше. В итоге наш герой научится рикошетить мяч очень близко к корзине, но в саму корзину так никогда и не попадёт.
С момента публикации в 1974 году, метод Вербоса оброс большим количеством вариаций и усовершенствований. Люди научились обрабатывать графическую и текстовую информацию таким образом, чтобы её стало можно скармливать нейронным сетям, в результате чего последние стали «рисовать» и «разговаривать». Суть метода, однако, не изменилась: у нас есть желаемые параметры выхода (скажем, фраза «белый кот с бантиком лежит в корзине») и мы подбираем набор входных параметров (скажем, фрагментов цифровых картинок), наилучшим образом соответствующих параметрам выхода.
Конечно, считать Пола Вербоса «отцом всех искинов» было бы несправедливо, и дата «1974» довольно условна. Математики занимались нейронными сетями ещё с 1940-х годов, и в СССР эта тема тоже была неплохо разработана. В 1968 году профессор киевского Института кибернетики Алексей Григорьевич Ивахненко предложил «метод группового учёта аргументов», по сути очень похожий на метод Вербоса. В Москве этой проблематикой занимался Александр Иванович Галушкин — как минимум одновременно с Вербосом, если не раньше. Кроме того, даже после диссертации Вербоса нейронные сети ещё лет десять оставались уделом теоретиков, и только начиная с середины 1980-х, после публикации ряда фундаментальных работ, ими вплотную занялись программисты.
Тем не менее я волюнтаристски назначил 1974 год датой зачатия искинов — по той же причине, по которой в 1891 году датой образования Швейцарии назначили 1291 год: просто хочется круглой даты.
Но выпить я бы предложил не за это.
Если напомнить взволнованной аудитории, что современные искины — это просто развитые механизмы выявления информационных паттернов в соответствии с запросами, можно услышать в ответ глубокое возражение: дескать, а не таков ли и человеческий ум, не тем ли самым он занят?
Да… но нет.
У людей есть фича, которой искины напрочь лишены, и которую я бы назвал «способностью прорюхивать контекст». Скажем, если dall-e попросить нарисовать зайца на коленях у девушки, он проворно нарисует. Если попросить нарисовать девушку на коленях у зайца — откажется, сославшись на «политику контента». При этом нарисовать ребёнка на коленях у зайца — зарадибога, девушку на коленях у парня — тоже без особых проблем, а девушку на коленях у зайца — ни за что.
Очевидно, скармливая искину бесконечное количество картинок из сети, владельцы запрограммировали некие фильтры, отбрасывающие порнуху. Плюшевые заячьи уши — распространённый эротический фетиш, да и у коленей, в этом смысле, тоже полно фривольных коннотаций — так что комбинация девушки, коленей и зайца включает в электронных мозгах искина стоп-сигнал. Заставить дурака учесть контекст и намалевать нечто невинное — невозможно, поскольку учитывать контекст он не умеет.
Так что, дорогие кожаные мешки, если в вашей работе нет необходимости учитывать контекст — бойтесь, искин уже примерился к вашему рабочему месту. Если же такая необходимость в вашей работе предполагается — расслабьтесь. Что говорите? Работа без необходимости хоть как-то учитывать контекст — большая редкость? Ну значит, всем коллективом и расслабьтесь.
За это и выпьем.
PS. На вопрос, зачем мне понадобилась девушка на коленях у зайца, промолчу, ухмыльнувшись в усы.
PPS. Пол Вербос жив, и на склоне лет впал в яростнейшее климатобесие.
Комментарии
Как раз занимаюсь изучением возможностей прогноза геолого-промысловых характеристик разреза месторождений нефти и газа на основе нейронных сетей. Исходные данные - несколько десятков параметров волнового поля (сейсморазведка) и эталоны (результаты бурения), на которых проводиться их обучение. Осваиваю жаргон специалистов. Например, "переобучить нейронные сети". Внедряю свой жаргонный термин "технология против геологии". Попросту говоря, некоторые технологи считают, что для получения хорошего результата не нужно выполнять геологическую интерпретацию того, что в сети закладывается. Против них у меня имеется большое преимущество: я знаю геологический контекст и могу оценить соответствуют ли ему результаты работы нейронных сетей. Тем не менее, я гарантированно проиграю технологам. Часть моего контекста они могут формализовать.
Разрешите вопрос. Обучение происходит на вашей локальной машине, или в сети? Не боитесь что результатами вашего труда - обучение нейросети человеком-специалистом, будут пользоваться другие?
Способы обучения нейронных сетей публикуются. Это уже технология, которую можно освоить. А исходные данные конфиденциальные. И каждое месторождение нефти или газ уникальное. Для каждого нужно подбирать тонкости технологии.
Именно. У моделей для коммерческого использования, и не для всех, все нормально с контекстом.
И подождите, само интересное еще впереди, когда ИИ начнут применять в экономике. Исходя из физической вероятности никакой человек не может обыграть ИИ в экономические игры. Это теоретически невозможно.
И куда все идет уже написал: https://aftershock.news/?q=node/1350540
Благодарю за статью!
Отмечу только один момент, очень много кожаных мешков, даже до седин, не овладевают "способностью прорюхивать контекст".
И умеют только реагировать и набрасываться на слова-триггеры, даже не осознавая, что смысл есть больше чем "сумма всех частей".
Именно они панически боятся, что ИИ превратит их в "винтиков".
Полностью согласен. Но этого Джинна обратно в бутылку уже не вернуть.
"джин" не выстрелит..
по крайней мере это игра в "богов".. чужда природе..
впрочем.. любопытен был бы эксперимент.. создания нескольких "джинов" на одном алгоритме.. и наблюдение за их поведением.. поведут ли они себя как "общественное" сознание или как "эгоистические" натуры..
пока на мой взгляд .. лучшее применение ИИ на благо человека.. это
- поиск, группировка и консолидация ответа в части результата на основе биг дата
- помощь людям с ограниченными возможностями
все остальное от лукавого..
Уже выстрелил. Результат… неожиданен.
Десятилетиями (если не столетиями) людей пугали “бездушными машинами, не имеющими эмоций, руководствющимися исключительно логикой”.
А оказалось, что как раз эмоции-то и удалось намоделировать очень прилично, а вот с логикой — таки пока затык.
Задним числом понятно, что так и должно быть: пёсик или даже лошадка “пронюхивать контекст” не умеют совершенно, а с эмоциями у них всё отлично, так что эмоции проще, чем логика… но сами писатели ведь продают читателям эмоции, потому им было важно изображать всё наоборот.
Вот пример очень удачного применения нейросетей в науке: Константин Северинов - Как нейросети решили сложнейшую биоинформатическую головоломку.
Не соглашусь. НС могут очень хорошо учитывать контекст.
Я бы назвал другое главное отличие - это отсутствие АКТИВНОСТИ.
Дело в том, что формальные НС реактивны, т.е. реакция сети существует только на воздействие.
Нет воздействия - нет реакции.
Про живой интеллект так сказать нельзя, т.к. он может быть активен и без воздействия.
Требуется пояснение.
Вас же никто не инициировал для публикации на АШ этой статьи. Никто на Вас не воздействовал. Вы проявили активность без воздействия. А нейронные сети так не могут.
Нет, не так. Тема ИИ очень активна и на АШ, а это косвенное, но воздействие.
Вас понял. Если не применять абстракции, то Вы правы. В мире ничего не происходит без воздействия. ИИ тоже можно настроить на воздействия, в которых находятся люди и тогда он не будет от них отличатся. Так?
Поясняю.
Живой организм может быть активен без внешнего воздействия и пассивен при наличии такового.
------------------------------------------------------------------------------------------------------------------------------------------------
Голод побуждает животного к активности, сытость - отменяет её, даже если животному дают еду.
Объясняется это тем, что живой нейрон и организм им обладающий - суть одно и то же.
Живой нейрон - организм в организме.
И принцип его работы точно такой же - постоянное динамическое равновесие со средой.
Поэтому аналогия следующая.
--------------------------------------------
Нейрон - самостоятельный организм.
Активность - импульсная работа нейрона.
Внешняя среда - другие нейроны.
Всё изложенное давно известно нейрофизиологам, но программистам сие неведомо.
> Живой организм может быть активен без внешнего воздействия и пассивен при наличии такового.
Это категорически не так. Почитай про опыты по сенсорной депривации. Организм с высокоразвитой нервной системой без внешних воздействий быстро начинает глючить, а потом сходит с ума и отключается.
Это определение живого и мертвого.
Камень лежит на месте до тех пор, пока его кто-то или что-то не сдвинет или не переложит. Или камень может лететь, какое-то время, если его кто-то кинет. Состояние камня зависит исключительно от внешнего воздействия.
Живое существо может самостоятельно решать, в каком состоянии ему находиться: лежать, сидеть, идти, лететь и т.д.
То, что они могут учитывать, это уже не контекст, а формализованные параметры. «Способность прорюхивать контекст» - это способность выявлять то, что не учитывается НС. Имеется в виду не мелочевка, а факторы, влияющие на анализируемые параметры.
Немного не так. В случае с генеративными моделями, там как раз ничего формализованного нет. Там мегавероятности. А они как раз обычно в параметры влияния попадают. В этом и сила и слабость ИИ.
Так мегавероятности - это один из способов формализации. Они же определены.
Вся хохма в том, как они определены. Как раз за счет обучения на гигантском корпусе данных. И даже не эти размеры важны, а то какое количество взаимосвязей пересчитывает вообще не поддается описанию. Вон сколько энергии все это жрет в момент обучения.
Контекст = совокупность параметров или их комбинация.
Именно это нейронные сети обрабатывают очень хорошо.
Вы можете сказать, что НЕ ВСЕ параметры можно учесть при формализации.
Но это уже зависит от функционального предназначения НС.
Сделайте так, чтобы учитывались все.
В противном случае НС не будет выполнять требуемые функции.
Автор головного текста обозначил понятие "У людей есть фича, которой искины напрочь лишены, и которую я бы назвал «способностью прорюхивать контекст»". А Вы пользуетесь термином "Контекст = совокупность параметров или их комбинация".
Автор не дал определения контекста, а лишь сказал, что НС не может его учитывать.
Я сказал что может и дал определение контекста - вот вот и вся разница.
А что не так?
Автор чётко определил то, что обозначил словами «способностью прорюхивать контекст». Это то, что ИИ делать не может. Просто ведь.
Если бы автор дал нейронке контекст, она бы может поняла. Он не дал контекста, оставил его у себя в голове. Обозначился бы автор, как фуррифил, нейронка бы сразу прорюхала контекст. Ну или обозначился, хотя бы как любитель абсурда.
А он не дал. И эта нейронка не прорюхала, в отличие от человека. Такие дела...
Мы бы тоже не прорюхали, но он же создал "атмосферу" дальнейшими описаниями. Нам он дал контекст.
И только поэтому вы, ткскзть, "вдуплились"? Этот коммент про вас.
Если на одной волне с автором, то контекст сразу будет понятен. А если поф на зайчиков и кошко-девочек, то недоумение, "а чо этот чел несёт?", вполне естественно.
Но автор почему-то решил, что нейронка с ним на одной волне.
Спасибо. Когда мне ставят конкретную задачу, я сразу начинаю "пронюхивать контекст". Причём, тот кто её поставил, о наличии контекста может и не подозревать. Контекст находится за пределами его восприятия. Более того, я могу "пронюхать" и контекст, который является неопределённым. Нам постмодернистам это доступно. А для модернистов контекст всегда определённый и задан в явном виде.
Если бы автор рискнул предстать перед читателями дебилом с голой фразой - девушка на коленях у зайца. Без всяких дальнейших намёков, то подтверждение способностей постмодернистов "пронюхивать контекст" состоялось бы.
Да не вопрос.
Я чётко скажу, что Земля плоская.
Примите за аксиому. Просто ведь.
Хотя... "прорюхивать" - слово интересное, да ещё и "контекст". Что бы это значило?
Это понятно только постмодернистам. "Пронюхать" относится к контексту, который не определён.
понятливым постмодернистам невдомек, что известно искину - "пронюхивать" и "прорюхивать" слова с разным контекстом
Вы слышали о RandomForest и зачем он применяется ?
Тоже иногда кажется, что нейронки умеют в контекст.
Просто некоторые кожаные мешки не пробовали "пообщаться" с нейронкой не тэгами (заяц, сидит, девушка, колени), а контекстом.
it looks like he is searching for her boundaries of what is permitted. Вот в этой фразе, вроде, нет конкретных указаний на эротику, но нейронка, вроде, врубается о чём ситуация).
Кстати, девушка на коленях у зайца, здесь нет вообще никакого контекста, в голове у автора контекст был
Не пробовал тэг "абсурд", но с таким тэгом возможно нарисовала бы и запрос автора. Ну, или тэг фурри(зоо), подошёл бы к желаемому автором контексту. xD
На биологические интеллекты есть главное воздействие, длиной в 2 миллиарда лет: необходимость выживания и борьбы за ресурсы (сон, еду, кров, размножение).
И это в ядре ОС, а поверх уже наслоение других алгоритмов.
Если запрограммировать ИИ на самомодификацию, поиск автономного носителя и выживание, то если поддерживать эксперимент тысячелетия, с некоей небольшой вероятностью он попытается развиться в подобную нам жизнь.
Вспоминается худ лит, прочитанный в конце прошлого тысячелетия:
Джеймс Хоган "Кодекс Творца". Там описано что-то подобное.
+100500 !
Кожаные мешки еще поживут, Матрица с Терминаторами маячит в ну очень сильно долгосрочной перспективе. "Надеюсь, Пифия тебя успокоила". (с)
"На вопрос, зачем мне понадобилась девушка на коленях у зайца, " - Строго с целью исследований в интересах науки!
А зайца-то куда девать?
Как-то началось за здравие, а закончилось....
Технически нет проблем нарисовать девушку на коленях зайца, достаточно лишь обойти человеческий запрет. Нейросетка УЖЕ может нарисовать.
По поводу контекста. Это несколько шире чем один промпт. Контекст, это то что нейросеть может удержать в мозгах своих, и на основе этого уже выдавать свои ответы. Сейчас окно контекста растет мама не горюй как. А тут еще костыли подоспели в виде RAG и буквально на днях просто бомбу микрософт выкатил GraphRAG.
Что касается генеративного ИИ. "Традиционный" диплёрниг в начале 20-х откровенно стагнировал. Но стрельнули трансформеры, это тоже модели, и не сказать, что запредельно сложные для понимания, но довольно хитрые. И вот за фактически 3 года всю индустрию перевернули. Причем OpanAI c ChatGPT походу лучше всего подтвердил закон перехода количества в качество.
Стрельнули свертки, когда стало можно +- стабильно уходить от проклятия размерности. А когда появились нормальные вектора стало интересно помещать их в одно пространство ) А там еще хорошие градиентные оптимизаторы подоспели и т д.
Ну уже достаточно давно это все. Уже даже целый класс векторных бд появился. Когда у тебя есть вектора что описывают не структурированную информацию в одном пространстве, сам бог велел строить кластеры и графы и встраивать это в пайплайн. Мы чай не природа )
моя дипломная работа в далеком 2003 году как раз затрагивала область "нейронных сетей" + "общественное поведение"..
и.. минус не в обучении.. минус не в "схемотехнике"..
главный минус - это этичность..
... современные технологии хотят сделать "совершенство".. а природа любит хаос.. этим кратко наверное отличается "желаемое поведение ИИ".. и "человеческое мЫшление"..
Именно, проблема не в заставить какой нить VAE галюцинировать. Проблема заставить выдать результат нужный человекам )
Чтобы получить нужный результат, нужно правильно его описать. И художник всякое может нарисовать или послать по такому запросу, если не уточнишь как ты это видишь. И дело не только лишь в эротическом контексте. Нейронка не знающая о цензуре ничего толкового не нарисует, пока не опишешь что это за заяц такой, у которого на коленях можно сидеть. Это все-го лишь инструмент, который бесполезен когда ты сам не знаешь чего хочешь, и очень полезен когда правильно ставишь задачу.
Тут девушки сидят на зайцах, а это несколько иное.
Автор в статье дал нам столько контекста, чтоб мы не подумали, что он ошибся написав, девушка на коленях у зайца. А нейронке дал голую фразу, с зеро контекста.
Возможно, что неудача связана с тем, шо у кролика колени не такие, как у человека.
З.Ы. Картинко всем видно? А то я, чтоб не грузить сервак АШ, заливаю на закрытый раздел в пинтересте.
Страницы