Генеративный ИИ Ч.5.1. ГИИ Прогрессор. Начало

Аватар пользователя user3120

Введение. Данный текст это взгляд на потенциальное более "человечное" будущее развитие ИИ с точки зрения практика и реалиста, в мире победивших маркетологов с виртуальными цифрами успехов и улучшений ИИ+.

Дисклеймер. Ниже текст об "ИИ улучшении"(и не только), с элементами как техногика так и капитан очевидность. Читайте на свой страх и риск.

Для "краткости" обсуждаемая в статье концепция развития ИИ здесь и далее будет называться Улучшайзер Улучшитель*. Смысл данного слова и его синонимов* - в полной мере описывает концепцию "улучшения" для дальнейшего приоритетного, с моей точки зрения, направления развития ИИ/ГИИ.

***

"Улучшение". В этом, с виду, простом слове - косвенно или прямо заложена суть эволюции(почти синоним) жизни на Земле (биосферы), а также развития/эволюции цивилизации / человечества и в чем-то даже суть человека, как условного "Прогрессора". Человека, который на каком-то этапе стал катализатором "техно" эволюции/прогресса Земли. А то что ускоренная эволюция несет ускоренные энтропийные "турбулентности" - это уже другой вопрос.

... Поэтому когда утверждаю что (в качестве предварительного шага) необходимо сфокусировать развитие ИИ на возможности (мультимодального) улучшения всего и вся, что можно улучшить, - это не фигура речи и не прихоть или причуда, а то на что действительно имеет смысл обратить внимание(инвесторам и ЛПР) и довести этот вопрос до предела.

"ИИ улучшитель" ИМХО - то что сегодня может дать толчок / второе-третье дыхание ИИ, а также пендель развитию/улучшению/эволюции не только самого ИИ, но и потенциально/в теории многих значимых сфер деятельности человека, где еще есть потенциал для улучшения/эволюции, как побочный продукт развития ИИ и дальнейших инвестиций в данную область. 

2.1 Предыстория и способ реализации улучшений с помощью ИИ.

На сегодня (и местами еще до нейросетей) с помощью самых простых, чуть ли не аналоговых, методов создали много специализированных проектов улучшения как аудио(шумоподавление), так медиа(аудио, видео, игры). Современные ИИ внедрены в конструирование (что можно интерпретировать как улучшение продуктов). Список намного больше, но данная область ИМХО все еще недооценена. 

Чтобы изменить(дообучить) нейросеть в желаемом направлении обычно используют современные технологии Fine-Tuning, обучение с учителем, AI-тренеры***.

"Улучшитель" - если упрощенно - это специально натренированный  "ИИ агент" на теме улучшения и на ТРИЗ+(в обучающих книгах по изобретательству), на всех материалах что хотя бы в малейшей степени имеют отношение к теме.

Fine-Tuning и все материалы что под него собраны фактически можно использовать как отдельную специализированную библиотеку чтобы патчить любой ИИ совместимый с данной технологией. Или можно добавить материалы в само ядро ИИ (КО).

Можно в качестве AI-тренеров посадить 500 индусов (и/или детей с высокой фантазией или даже пойти в психиатрическую лечебницу набрать аутистов и запустить интересную "игру") и слепить из всего этого по удаленке или офлайн материал для коллективного агента / аватара по базовому улучшению простых рандом вещей из списка 50к того что нужно улучшить.

Все это относительно легко реализовать при достаточном финансировании и в данном направлении (в т.ч. по информации в открытых источника и опен сорсе) можно публично продвигаться по большей части обычных улучшений к обычным объектам для улучшения, за исключением закрытых (коммерческой и государственной тайной) топ областей и объекто на рубеже (передовом крае) технологий и науки (пример, чипы), где сегодня все еще патентуется много изобретений...

Эти области в части доступности ШНМ и компаниям что работают с ИИ будут развиваться медленнее в закрытом режиеме за исключением возможно Нвидеа, по крайней мере ради маркетинга саморекламы и продвижения суперкомпьютеров для ТНК.

Также статистика по ТНК может показать рост числа патентов и в теори могут начаться патентные ИИ войны(по аналогии с "Звездными войнами" в области вооружений). 

***

Частично но относительно сложно(в плане объяснения ИИ) ИИ можно обучить мультимодально по  существующим патентам, рац. предложениям и по сборникам в которых написаны наиболее интересные из них (используя огромные вычислительные ресурсы). В патентах/изобретениях можно отследить эволюцию улучшений. Все что можно улучшить и есть в мультимодальных можно перевести на "условно машинный" язык улучшения (подобный ТРИЗ), чтобы потом можно было применять улучшения к чему угодно.

С другой сторон как в фотошопе для улучшения текстов и обработки текстов возможно понадобятся более сложные многостадийные алгоритмы. 

Также прежде чем что-то улучшать (при применении агента улучшеня) лучше заранее поинтересоваться бюджетом для улучшения и в каком направлении планируется улучшать.

2.2. ("Из черновика"/могут быть повторы и пересечения с другими частями текста) ~ Нюансы и варианты как (до)обучить ИИ.

3.1. Что такое улучшение? Метод мозгового штурма.

Улучшения (если это не бруте-форсе метод как единственная возможность улучшения где может использоваться метод постепенного приближения) - делаются по (адаптированным для AI-тренеров) правилам метода мозгового штурма

ru.wikipedia.org/wiki/Метод_мозгового_штурма

[Возможно неспешное удаленное многозадачное улучшение по 5-10 родственных заданий за раз(без использования ИИ) - лучше чем авральный "высокопроизводительный" метод работы (зависит от темперамента людей(тренеров и стиля их мышления))]

Условно если переводить метод мозгового штурма на язык ИИ одновременно с возможностью  внутреннего контроля(сравнительного теста) результатов можно проводить в три или более этапов.

1 - Мозговой штурм, 2 - улучшение сделанных в результате мозгового штурма предложений. Каждый этпап делают разные команды (перекрестно) или люди (люди с критическим мышлением (не творческим) переводятся на этап отсеивания). На всех этапах результаты (ИИ и людей) по сути объединяются, а ответы улучшаются ИИ если не по содержимому то по форме к единому стандарту чтоб нельзя былор различить ИИ и человека..

На последнем этапе делается критическая фильтрация объединенных предложений (ИИ и людьми) на основе их (логической и экономической обоснованности и соответствии критериями улучшения) отбраковка и поиск условно таких топ 3 улучшений (может быть и больше при их равноценности), что лучше соответствуют заданным условиям. Если что-то хорошее близкое к условиям, то тоже приводится с пометкой о несоответствии. Если нет критериев то приврдятся дефолтное условие. к примеру что имеют наибольший шанс реализации с наибольшим экономическим успехом[old: по степени вероятности или успеха или экономической(коммерческой) обоснованности их(улучшения) применения]. Плюс в логе делается расстановка остальных найденных (второстепенных) решений с присвоением баллов (быстро качественно дешево) (возможно оценками что даны уже ИИ (с редкой ручной проверкой)). Полюс делается лог/протокол улучшений (с обоснованиями (в т.ч.с цифрами) чем плохо хорошо улучшение что оцениваются отдельно судьями (сразу людьми потом после обучения создании ИИ - судьи уже ИИ)). 

Любые объединенные промежуточные и конечные результаты (а будут и дублированные) можно декомпилировать к исходным оценкам и авторам обратно чтобы точно посчитать результаты команд (ИИ vs люди). 

Экспертный этап — группировка, отбор и оценка идей. немного ассоциируется с смешным названием "100 мудрецов" (у Сократа).

В конечном итоге в качестве результата потребителю по запросу выдается любая информация из проведенных работ(включая лог если в нем нет коммерческой тайны как все это работает). А если кратко (по дефолту), то топ 3 улучшений что максимально соответствуют начальному запросу (включая обязательный параметр бюджета) или имеет смысл реализовать(можно цифру изменить или посмотреть лог проведения анализа (можно также сделать краткий анализ или максимально полный в зависимости от кошелька задающего вопросы(в т.ч. на любой бюджет улучшения))).

Возможно что-то из этого частично (не сравнимо с проф. уровнем) уже реализовано в новых моделях чат ботов (алгоритмического мышления не помню как он там называется) ИИ (и даже с мини мозговым штурмом, который возможно  замаскировано под просто якобы мышление, для того чтобы метод было сложнее скопировать/воспроизвести другим(чтобы замедлить их развитие)). 

***

Некоторые второстепенные идеи и замечания п.3

4.1 Тестирование. 

При обучении улучшению возникает закономерный вопрос: Как сравнить (провести сравнительный тест) ИИ vs человек области улучшения чего либо? И как (программистам и инвесторам) понять что их модель ИИ движется к поставленным целям и задачам в процессе обучения, а не стоит на месте или наоборот деградирует а инвестиции сгорают (тогда надо смотреть что сделано не так и делать откат модели)? Т.е. как протестировать или измерить конечный или промежуточный продукт и результат выдаваемый сторонами и соответственно прогресс проекта по созданию ИИ улучшителя превосходящего возможности человека?

***

К примеру, должна проводиться слепая оценка результатов с выставлением баллов за каждый чих (как проверка (олимпиадных задач повышенной сложности включая творческие) работ или при спортивном судействе где дополнительно оценивается и художественная составляющая (в данном случае может оцениваться "креативность"/неординарный подхож)). Естественно судьи не должны знать кто писал ответы на задания. Ответы даются в тесном перемешивани (объединении) как ответов ИИ так и людей приведенными, ИИ к одному стандарту выражения через рерайт причем ИИ рерайтер может попросить людей пояснить что они имели ввиду эквивалентен ли рерайт исходной идее (если есть двойственное понимание или вообще ничего не понятно в ответе) возможно со снятием некоторого количества баллов при очень грубых (содержательных) ошибках в тексте (и только если не понять в чем суть идеи, то смотрится исходный (не рерайт) текст (людьми из дополнительной команды - рерайтером)).

Это делается чтобы простыми средствами нельзя было выявить ответ людей по их несовершенству(кривости оформления) изложения/мысли (и чтобы судьи люди (на последних этапах такие будут уже редкость) - могли судить в пользу людей (ИИ также ради тестов (выявления наличия  влияния изложения на оценку задания) - может имитировать "человеческий" стиль изложения мысли)).

4.2. Формальный (или не очень) критерий превосходства ИИ улучшителя над человеком (далее которого (на начальной стадии становления ИИ) обучать улучшению далее экономически нецелесообразно*).

* из-за проблемы падающего возврата(должны быть другие области где обучение принесет кратно лучший эффект и будет целесообразно и прибыльно (давать существенное улучшение) и только когда все подобные области и "вектора" закончатся - можно снова вернуться к данной области, т.к. при той аудитории что обращается к ИИ траты на обучение окупятся при любом раскладе ИМХО (если подобного продукта не будет у конкурентов(тогда будет идти речь о двойной работе и или придется сравнивать много моделей между собой чтобы выявить лидера и поделить рынок и определить цены согласно качества предоставляемых услуг))). 

Что считать критерием превосходства ИИ над человеком в области улучшений? Навскидку, это тот момент когда условно в 90% отраслей из списка топ 100 (и 100% из топ 20) ГИИ улучшение покажет систематическое  превосходство над человеком (или паритет что приравнивается к превосходству). Такое цифровое "превосходство" вполне возможно выразить в цифрах (особенно при повторении тестов), убирая элемент субъективности и используя метод слепого оценивания результатов и промежуточных результатов. (причем судьями тоже выступают на первом этапе как так и люди. А на последующих этапах (после тренировки судьи ИИ судьями людьми) и для экономии средств и времени - в 90+% случаев оценку должен делать уже ИИ).

***

5. Потенциальные аналоги "улучшения". Векторное мышление. [Мышление через действие]. Базовые "программы" человека. Импринтинг. 

Вероятно наиболее важный вектор(инстинкт к действию) для человека (хотя и относительно бесполезный для ИИ) это выживание  (самосохранение, маскировка / мимикрия), коллективное / расовое / видовое выживание(может включать самопожертвование). 

Импринтинг (информационно-физическое обучение) в первой четверти жизни человека(Фаза активного восприятия мозгом информации из окружающей среде - причина почему детдомовские дети или "гарлем"-дети в своей массе(за некоторым исключением) больше похожи на маугли (каменных джунглей) чем на людей). И следование шаблонам информационного кода с целью получения ментальной (или химической) награды от мозга - в оставшееся отведенное время жизни человека. 

Общие стремления (во время импринтинга зависит от среды воспитания) развиваются по следующим направлениям (если развиваются): 

Стремление к любви, удовольствию, радости, богатсву, здоровью(включая психическое), процветанию, уважению, к интеллекту(медицина), силе, красоте, совершенству, генетическому совершенству. Распространение (как информационно / социально, так и через отпрысков). Запечатление в истории. Продвижение(реклама). Получение известности славы. Потребление. Удовлетворение. Познание(мира)/обучение. Самоутверждение/Возвышение. Единение. Понимание. Самоактуализация. Поиск истины. Поиск смысла жизни. Достижение поставленных целей. Инсайт(как продукт подсознательной деятельности (равно достаточно полноценное общение с подсознанием)). Очищение. Поиск причинности. Эволюция. Поиск религиозного, атеистического,  рационального, иррационального, научного, философского смысла жизни. Поиск себя, поиск истоков. Игры(игры бывают разные и разного масштаба реальные или виртуальные или смешанные без интереса или на интерес). Стремление к победе / к вершине. Стремление к эстетике / прекрасному. Хорошо там где нас нет(стремление к мечтам).  Отдых, безмятежность, стремление к косвенной или прямой нирване (отсутствию страданий для себя и для других). Косвенно или прямо это программные коды человека. 

Также во время импринтинга(запечатления) у человека (и не только его) развивается избегание (по сути всего что обозначено в стремлениях человека с обратным знаком):

Избегание боли (избиений, психических избиений) и несчастий, страхов стрессов работы на износ, избегание неуважения, оскорблений в итоге смерти (рано желение получить бессмертие косвенное (через детей, известность...) или прямое (косвенно воплощается через мечты и виртуальную реальность)).

Через неправильный импринтинг(неправильное нехарактерное или контрвыживательное выживание в первой четверти жизни) полагаю у человека и не только у него могут развиваться отклонения в психике (создаваться неправильные шаблоны и программы что будут подтверждаться мозгом как полезные для "выживания" (приносящие награду и удовольствие от мозга)). В частности БДСМ. Антисоциальность. Протестное поведение. Криминальность. Весь справочник психических болезней. Этому учат или должны учить психиатров и криминалистов.

Как спасение утопающего дело самих утопающих - об этом должны знать зависимые от алкоголя и других вредных привычек люди(курение, игровые зависимости, зависимость от беспорядочных 18+ связей и просто от процесса (гедонизм)). Ведь четкое осознание проблемы (если человек может её осознать) - первый шаг к позитивному перепрограммированию запечатленных поведенческих шаблоном. 

Именно запечатление (в разной воспитательной среде) делает людей разными*

*Если брать аналогии от природы, то можно вероятно даже найти эффект кукушки - эффект белой вороны (опыт мимикрии), как работает(самовоспроизводится?) инстинкт выживания через "подбрасывания" поневоле/или вполне сознательно своих отпрысков(своего яйца) в чужое гнездо (и желательно меньше "размером", где будет баф силы?) (далее чаще всего выбрасывание из гнезда не вписавшихся в рынок)? (системы приемных родителей).

Выживание в комплексе (с точки зрения оценки мозга) или нормального воспитания (в идеале) должно приучать к созидательному труду как к фактору способствующему оптимальное выживание. Но в первой четверти жизни человек максимум учится и не особо запечатлевает труд как базовый способ выживания. Детский труд чуть ли не табу в современном мире. Но это уже другая история (к чему приводят ошибки запечатления и что вообще такое - вообще главные ошибки воспитания и запечатления в первой четверти жизни). Также выживание (и запечатление) человека родившего с золотой ложкой во рту (в золотом миллиарде) и человека родившегося в нужде и бедности с самого детства будут сильно отличаться. 

То что представитель настоящего золотого миллиарда (а он сам по себе внутренне разделен) первую четверть жизни не испытывает сложностей выживания (людей развивающегося мира (даже в качестве опыта жизни в этой среде к примеру 1 год как существо брошенное в воду или из гнезда что должно научиться летать)) и не получает корректного/адекватного опыта выживания и жизни

Скаутское движение (англ. Scouting) — всемирное юношеское движение, занимающиеся физическим, духовным и умственным развитием молодых людей. Слово «скаут» переводится с английского как «разведчик». Поэтому скаутинг также иногда называется разведчеством.

(как фактор запечатления) возможно является существенным недостатком образовательной системы человека (или детенышей людей). Гарлем воспитание может ломать жизнь и в то же время может давать какой-то бесценный опыт когда у человека возникает инстинкт и желание выбраться из этого не сильно способствующей жизни и выживанию среды любыми средствами даже если до конца жизни придется упрорно трудиться 996 и выбраться смогут в лучшем случае лишь дети.

***

Риторический вопрос: Что произойдет с ИИ если ИИ получит подобный опыт или запечатление или программный код? Насколько такой ИИ (еще и разный с уникальным характером) станет более похожим на людей?

в данной части следует понимать что из меня психолог и знаток человеческой природы 

как из доярки – балерина, как из зайца – машинист, как из лягушки – прокурор, как из пингвина – сокол

В том плане, что это скорее диванное мнение, которым успел нахватался по опыту жизни. И хотя здесь есть интересные идеи эти сведения нуждаются в проверке. Наверное прибежит толпа психологов что начнет спрашивать а какое у меня образование и т.д.

Т.е. спасение утопающих - дело рук самих утопающих - это ваша проблема копать в этих направлениях и проверять гипотезы и предположения. У меня нет средств и времени проверить мои гипотезы на научную чистоту (найти подтверждающие примеру (а наука сегодня такая что всегда можно найти и контр подтверждающие примеры))

***

Кроме подобных видов интеллектуальной деятельности - вообще видов востребованной (легко монетизируемой) интеллектуальной деятельности человека (по примеру "улучшения") или видов работ для ГИИ достаточно много. Можно составить топ 50 современного информационного мира(здесь достаточно узкий список "по аналогии", а вообще надо смотреть общий список):

Например: рерайт,  модификация, написание чего-то похожего (истории, сценария, статьи) с нуля, синтез, анализ данных, обход патентов("взлом"), патентный троллинг, патентное сквоттерство, создание сиквела, приквела, спин-офф и далее по списку.

Все эти "вектора" можно выделить как "процессы" и разбить на части и алгоритмы для разных мультимодальных объектов. По аналогии как это делается  с "улучшением". Это будут векторы("движения") что работают с мультимодальными статическими объектами или данными изменяя или создавая их. Медиа мультимодальные ремейк, ремикс, кавер. Одна и та же  топовая история может быть рассказана как в стиле историческом, фентези, киберпанк, н/ф, боярка или что там могла бы быть "переведена" ИИ по скрипту одним нажатием кнопки с русского на русский, но в азиатском стиле (хорошо там где нас нет), что возможно расширило бы аудиторию(средний рерайт в азиатском стиле).

***


*синонимы для слова "Улучшитель" 

Прогрессор, улучшайзер, перфектор, оптимизатор, усовершенствователь, инноватор, модернизатор, амелиоратор, эволюционатор, ИИлевша

Синонимов для слова "улучшение" как действие производимое "улучшителем", также достаточно много

ru.wikipedia.org/wiki/Развитие

совершенствование, эволюция, прогресс, асцвет, усовершенствование, преображение, подъем, укрепление, усиление, продвижение, рационализация, обновление, метаморфоза, прогрессирование, улучшение эффективности, интенсивирование, эволюционирование, подвижка, шаг вперед

**Более подробно об этом и о многих других второстепенных идех по теме (и черновиках идей с примерами) - вынесено Ч.5.3.. Но когда дойдут руки до её оформления, редактирования и публикации если вообще дойдут - затрудняюсь ответить (лучше бы уже скорее допилили ИИ помощник улучшитель для работы с текстовыми черновиками).

***Общая информация некоторые ссылки на современное состояние ИИ

https://data-light.ru/blog/obucheniye-nejrosetej/

Пример Fine-Tuning'а из поиска:

https://sysblok.ru/courses/kak-doobuchit-jazykovuju-model-pisat-v-stile-dostoevskogo/

более свежие родственные темы

https://habr.com/ru/articles/830414/

Искусственный интеллект способен создать с точностью 85 процентов копию любого человека, потратив на это всего два часа. Уточним: не внешний облик, не голос, а поведение в различных ситуациях, черты характера своего реального прототипа. Об этом сообщают специалисты Google и Стэнфордского университета.

***

В вики можно найти актуальные ссылки на родственный темы:

en.wikipedia.org/wiki/Fine-tuning_(deep_learning)

***

Китайские разработчики ИИ стремительно догоняют Западные решения(новые алгоритмы позволяющие экономить вычислительные мощности).

https://habr.com/ru/articles/869748/

***

В Китае выпустили свою альтернативу нейросети OpenAI o1

https://4pda.to/2024/11/22/435445/v_kitae_vypustili_svoyu_alternativu_nejroseti_openai_o1/

***

Новые алгоритмы ИИ и обучения(возможно есть аналогии с китайскими ИИ):

https://www.youtube.com/watch?v=76k6OeVwvl0

***

Ютуб забросал опосредованно контекстными (к данному тексту) видео (возможно во второй части будут подробности). 

Авторство: 
Авторская работа / переводика
Комментарий автора: 

(в блоги) Подозреваю что поторопился с публикацией. Надо было 21+ публиковать. Т.к. блоги, то вторая часть будет опубликована по готовности(как только сделаю редакт).

Если вы понимаете 95+% текста и (мои) идеи в нем, то свою работу как автора считаю выполненной.

По эстетической составляющей - могут быть вопросы.

Но текст не ради эстетики писался и публиковался, а как возможность наиболее быстро познакомить читателей(а может и разрабов ИИ) с некоторыми интересными идеями что вышли за рамки комментария (а может и на какой диванный дисер по ИИ потянули бы(но это не точно))

(обратная связь важна (иногда))* Напишите если где-то серьезно накосячил по вашему мнению и информация (с вашими пруфами) не соответствует действительности (скрою под спойлер сомнительные части или попытаюсь доработать переработать(поискать в открытых источниках)). 

*Мелкие косяки упоминать не надо** понятно что их здесь достаточно много (только если расположены в критических местах или критические (мешают пониманию текста / создают двойственное понимание когда не понятно что имелось ввиду)).

**Если вдруг появится ИИ улучшитель текстов(возможно даже подписался бы), то он будет направлен как раз на устранение в первую очередь мелких косяков и недоработок. А вот у платных версий функции будут гораздо шире.

Комментарии

Аватар пользователя DjSens
DjSens(6 лет 7 месяцев)

Всё это разработчики ИИ и без тебя знают.

Что улучшать - решают пользователи ИИ, т.к. это затраты электричества, за которые платит пользователь ИИ.

Аватар пользователя user3120
user3120(9 лет 6 месяцев)

Основное отличие ИМХО что у ИИ разрабов закрытые(конфиденциальные) модели и алгоритмы построения их моделей ИИ (все это считается ноу-хау (зачастую патентует) и создает в дальнейшем капитализацию (только после ряда патентов начнут предоставлять информацию и выйдут на ИПО, а иначе любой с улицы сделает клон ИИ)).

Нет в условной ИИ википедии опен сорсе расписанных на пальцах алгоритмов и прямого пути к AGI с четкими сроками достижения. 

Если есть дайте ссылку (даже если на английском) будет интересно почитать.

Цель текста в т.ч. не дать западным разарбам запатентовать идеи изложенные в тексте. И т.о. получить ИИ монополию. Даже если это сомнительная попытка. Попытка не пытка. 

Идея текста как "идея-фикс" формально не стоила мне ничего(как вы отметили она самоочевидна). Больше времени на оформление в читаемый вид потратил и на дерево идей потратил в т.ч. во второй части (бывшая первая, но пришлось разбить из-за объема) на маршрут к "бета/альфа" AGI 

Так зачем пропадать труду и потраченному времени. Пусть он хоть в блогах повесит. Даже при этом текст свою функцию выполнит. Сделает топовых мировых разрабов чуть более грустными(и не такими самоуверенными), а их карманы возможно чуть более пустыми.

Аватар пользователя калибровщик
калибровщик(9 лет 3 месяца)

Бро, не надейся, что ты первый об этом подумал.

4го января Сэм Альтман (как ни относись к нему, но он сейчас самый влиятельный человек в мире ИИ) так описал свой текущий статус: «около сингулярности; непонятно, с какой стороны»...

 Большая часть смысла модели, такой как o1, заключается не в ее развертывании , а в генерации обучающих данных для следующей модели. Каждая проблема, которую решает o1, теперь является точкой обучающих данных для o3 (например, любой сеанс o1, который в конце концов натыкается на правильный ответ, может быть улучшен, чтобы устранить тупики и произвести чистую расшифровку для обучения более утонченной интуиции).» 

еще пример из истории развития новых версий AlphaGo: AlphaGo Fan, AlphaGo Lee, AlphaGo Master и последняя из версий AlphaGo Zero, обучившаяся уже исключительно на играх с самой собой, без использования человеческих данных. 
За 2 года условный рейтинг Эло новых версий вырос с 3300 (что было выше, чем у большинства профессионалов уровня чемпиона мира) до немыслимого для людей уровня 5185. После 2018 года компания DeepMind прекратила разработку и участие AlphaGo в официальных матчах, т.к. это стало неинтересно и бессмысленно – люди так и близко играть не могут

Аватар пользователя user3120
user3120(9 лет 6 месяцев)

Альтман много чего говорил(и не только он). Что формально пересекается с содержимым статьи. Вот нашел

https://habr.com/ru/articles/873110/

По ссылке. Прикольная модель что возможно лежит в основе o1

В 2023 году OpenAI выпускает статью Let’s Verify Step by Step, в которой они строят верификатор и учат модель рассуждать. Думаю, что это статья предвестник o1, вышедшей в 2024. Статья фокусируется на решении математических задач. В статье промптом заставили модель рассуждать шаг за шагом, а затем каждый шаг рассуждения рассуждения разметили разметчиками - приближает ли он к решению проблемы или он вообще ошибочный.

Полагаю что у меня другой подход скопированный(сплагиаченный) у методов решения задач человеком. Который к счатью фактически нельзя запатентовать т.к. он известен 100+ лет. Иначе Альтман его уже давно бы запатентовал.

Как уже вроде упомянул Альтман похоже сделал рерайт модели мозгового штурма (в более примитивной урезанной форме) и выдал её за свою идею и основы для о1 ИМХО. Открытие века короче.

Аватар пользователя калибровщик

Альтман сделал рерайт мозгового штурма (в более примитивной форме)

Чой-то "в более примитивной форме"? Если оно работает и давно даёт результаты. А о ныне достигнутых, он вообще говорит загадками.

Аватар пользователя user3120
user3120(9 лет 6 месяцев)

Чой-то "в более примитивной форме"? Если оно работает и давно даёт результаты. 

Работает и дает результаты веротяно как раз в оригинальной форме именно она работает. 

А публике показана примитивная форма чтоб никто не догадался и не мог повторить за 1 месяц или менее. 

Просто пусть Альтману другие разрабы или журналисты зададут вопрос на какой конференции:

о1 - это плагиат с модели мозгового штурма? Или её упрощенной версии?

Имеет ли модель о1 какое-либо отношение к модели мозгового штурма?

Интересно послушать ответы особенно после того как другие разрабы повторят о1 именно на основе модели мозгового штурма.

***

Альтман шифруется по полной(А микрософт как инвестор спонсор указывает что говорить и что не говорить). А как дышал, что его модели будут опен сорсе.

***

То что в основе AGI лежит режим "бруте-форсе" скорее в режиме алгоритмической многозадачности (фактически в отношении стремлений указанных в п.5, где на каждое стремление условно по "ядру", а иногда (когда уже не в фоне) и более), а не в режиме 100% загрузки что данный режим подразумевает на компьютере (в т.ч. так ИМХО работает подсознание), уже давно упоминал. Но теперь во второй части будет развитие данной идеи и даже будут даны формальные критерии AGI по аналогии с критериями успеха/достижения паритета с человеком для "вектора" "улучшение" (по аналогии с п 4.2. выше).

Аватар пользователя калибровщик
калибровщик(9 лет 3 месяца)

пусть Альтману другие разрабы или журналисты зададут ему вопрос

Сам спроси. Какие проблемы? Ты же считаешь, что опередил и обскакал его?

Аватар пользователя user3120
user3120(9 лет 6 месяцев)

Сам спроси. Какие проблемы?

Серьезные проблемы. Деанонимизация не для меня. 

Мне проблемы на ровном месте не нужны.

 Ты же считаешь, что опередил и обскакал его?

Где вы такое взяли? Или это просто вопрос на удачу?

Но ведь вы считаете что никто в мире гарантированно не может уделать Альтмана? Ни сегодня, ни завтра. Он непобедим. Так вы считаете?

(Пусть речь не о реализации хотя и она важна (это у Альтмана и вообще пиндосов не отнять)), но по авторству идей и концепций и в конечном итоге ИИ на этих концепциях и возможно в т.ч. в странах и компаниях контрзапада(Китай, Яндекс, Сбер). 

Пока же инициатива явно на стороне запада(по числу моделей). И до этих пор любые подобные тексты считаю актуальными(даже если не формат пульса). И работа по оформлению данных статей проведена не зря даже если специалисты по ИИ все это знают. Значит лишний раз убедятся что у них все четко и эта тема диванным специалистам не по зубам.

Аватар пользователя калибровщик
калибровщик(9 лет 3 месяца)

Но ведь вы считаете что никто в мире гарантированно не может уделать Альтмана? Ни сегодня, ни завтра. Он непобедим. Так вы считаете?

Мне просто любопытно, кто успеет в AGI раньше. Альтман или вы. Болею за вас.

Аватар пользователя Upgrade
Upgrade(3 года 1 месяц)

Зря вы так. Человек пытается выбраться из паутины информационного дерьма, которым всех кормит "социальное" общество.

И Альтман тоже не бог и сверх интеллект. Не лучше других.

Аватар пользователя Upgrade
Upgrade(3 года 1 месяц)

Ну вы смешали мечту и мышиную возню. Большинство человеческих потребностей и процессов современного социума это бесполезный мусор придуманный только для поддержания социальной стабильности(не справедливости, а только стабильности) и отсутствия голодных бунтов.
-
Что касается ИИ и fine tuning обучения, скоро в нем исчезнет необходимость.

Почему так? Потому что это необходимо только моделям с маленьким контекстом.

А если я вам скажу, что сегодня есть модели с контекстным окном в миллиард токенов. А завтра будут модели с контекстным окном в триллион токенов.

Зачем в таком случае контекстное обучение? Это противоречит смыслу математики. База данных всегда должна быть отделена от логики.
-
Что касается эволюции.

Как только начнется само-эволюция ИИ, эволюция человека закончится.
До этого десять-пятнадцать лет максимум.
-
Так зачем у вас в статье рассказы про мышиную возню? Это не имеет смысла.