В какой-то момент пытались унификацию привести, чтоб приставки кило-, мега-, гига- всегда означали тыщу, миллион, миллиард, а для 1024 и прочих 2²⁰, 2³⁰ решили последний слог заменять на "би" (т.е бинарный):

Киби (Ki)

Меби (Mi)

Гиби (Gi)

И конечно же, Йоби!

Войдите или зарегистрируйтесь, чтобы отправлять комментарии

(12 лет 11 месяцев)19:01-13/Ноя/24

Ах, вот откуда в Москве сеть кафешек «Йоби Доёби» была!

А я-то гадал!..

Войдите или зарегистрируйтесь, чтобы отправлять комментарии

(7 лет 1 месяц)18:25-13/Ноя/24

Войдите или зарегистрируйтесь, чтобы отправлять комментарии

(10 лет 2 месяца)17:11-13/Ноя/24

А вручную отобрать данные не судьба? В чем там конкретно проблема интересно.

В любом случае конкуренция высокая, инвестиции тоже, так что решение найдут.

Войдите или зарегистрируйтесь, чтобы отправлять комментарии

(9 лет 8 месяцев)18:13-13/Ноя/24

Потому, что текстогенератор - система вероятностного прохода по дереву статистических коэффициентов встречаемости в исходных данных.

Чем больше запихивать в базу, тем меньше различаются коэффициенты, и тем больше размываются границы классов.

Решение: специализированные решатели и экспертные системы.

Тот же Вольфрам Альфа.

А так-то заходим с другой стороны к базе знаний всего. У которой тоже есть жёпка: очень быстро граф знаний скатывается в абстрактные понятия, которые кратко не объяснишь.

Войдите или зарегистрируйтесь, чтобы отправлять комментарии

(10 лет 2 месяца)18:24-13/Ноя/24

Да, очевидно, к этому все и идет, к специализации моделей. А общая языковая модель это аналог поисковика, которая в будущем будет перенаправлять запрос к специализированному собрату.

Войдите или зарегистрируйтесь, чтобы отправлять комментарии

(2 года 9 месяцев)17:23-13/Ноя/24

Нехватка качественных данных

Кормить корову гнилым сеном, а потом ждать от неё хорошее молоко - вот уровень этих "фермеров".

Войдите или зарегистрируйтесь, чтобы отправлять комментарии

(9 лет 6 месяцев)18:04-13/Ноя/24

Хорошо сказано!

Войдите или зарегистрируйтесь, чтобы отправлять комментарии

(8 лет 2 месяца)17:43-13/Ноя/24

Ну правильно, поди начали загружать в бедную железяку тезисы и нарративы западных либералов, железка и начала сыпать в логи "егого 404 логика нот фаунд"

Войдите или зарегистрируйтесь, чтобы отправлять комментарии

(10 лет 3 месяца)17:48-13/Ноя/24

а я еще в 2017 году такое предполагал: нейросети берут инфу для обучения в интернете, одновременно они же генерят кучу контента, причем в таком количестве, в каком люди его не смогут сгенерить просто физически и весь этот контент в итоге попадает в интернет, со временеим становясь не просто значимым, а доминирующим по количеству, и к тому же трудно отличимым, а порой и совсем не отличимым от контента, созданного людьми

в итоге нейросети начинают учиться на контенте, созданном другими нейросетями, а порой на своем же собственном контенте, всё дальше и дальше замыкаясь в себе, отрываясь от реальности, но самое главное - отрывая от реальности людей, потому что те тоже читают и воспринимают весь этот контент, принимают его за реальность

по сути люди окажутся через какое-то время в ситуации, будто большинство книг и фильмов на которых они учились, выросли, сформировали мировоззрение были написаны и сняты шизофрениками и людьми с другими диагнозами, более того, как будто они выросли в семьях шизофреников

Войдите или зарегистрируйтесь, чтобы отправлять комментарии

(6 лет 3 месяца)18:26-13/Ноя/24

Инфу берут специально подготовленную и проверенную, такие конторы не пускают ИИ в интернет при обучении. Не знаешь - не пиши. Вот эта подготовленная инфа и кончилась. Думаю это тупик, умнее ИИ уже не станет, дальше нужно ИИ дать виртуальную песочницу для моделирования ситуаций, но это тоже сложно и дорого.

Войдите или зарегистрируйтесь, чтобы отправлять комментарии

(10 лет 3 месяца)18:51-13/Ноя/24

три раза "ха":)))

я не говорил, что нейросети свободно шарятся по интернету (по крайней мере пока)
но насколько вы можете быть уверены в том, что та инфа, которую где-то взяли и подготовили люди на самом деле не была сгененерирована ИИ?
ну вернее до сего момента, и может еще несколько лет вперед такая уверенность может быть: есть изданные книжки, есть старые видеозаписи, в т.ч. на том же Ютубе и т.д.
и вот она рано или поздно закончится
а вот всё, что вышло после 2022 года точно невозможно верифицировать: многие статьи, в том числе научные с высокой долей вероятности сгенерированы и выданы за свои мысли, многие картинки были сгенерированы и выданы за контент, созданный людьми, через какое-то время очередь дойдет до аудио и видео

многие тексты и картинки уже сейчас могут отличить лишь очень крутые профи, но для подборки объемов, нужных для обучения ИИ нужны тысячи "человекоботов", там квалификацией и не пахнет

а с учетом того, как всё в мире меняется, ИИ, который обучился на 100% верифицированной инфе из прошлого мало полезен из-за потери актуальности
и при этом тот, который постоянно дообучается опять же мало полезен из-за того что многая инфа не может быть нормально верифицирована уже сейчас

Войдите или зарегистрируйтесь, чтобы отправлять комментарии

(6 лет 3 месяца)19:45-13/Ноя/24

об этом и написано в статье - всю старую инфу скормили ИИ, новой нет и быть не может, всё и так уже обмусолено

Войдите или зарегистрируйтесь, чтобы отправлять комментарии

(8 лет 4 месяца)17:51-13/Ноя/24

= разработчики считают всякие Википедии и новостные сайты недостоверными источниками :)

Войдите или зарегистрируйтесь, чтобы отправлять комментарии

(12 лет 11 месяцев)17:54-13/Ноя/24

И правильно.

Их же рекурсивно этот самый ИИ и генерит.

Не рефлексируя, но распространяя.

Войдите или зарегистрируйтесь, чтобы отправлять комментарии

(12 лет 3 месяца)17:57-13/Ноя/24

чой то они быстра начали рукотворный кризис дот комов :()

неужели АГИ откладываецца, бггг :

полгода дефицита чипсов,отрезание поставок верхних чипсов в чину, дефицит видеопамяти, подпрягание сети гостиниц в таком обьеме что те забыли ~~забили~~ про свои камни

и всё якобы впустую ?

Войдите или зарегистрируйтесь, чтобы отправлять комментарии

(9 лет 6 месяцев)18:03-13/Ноя/24

Халтура!!!

Войдите или зарегистрируйтесь, чтобы отправлять комментарии

(9 лет 6 месяцев)18:03-13/Ноя/24

Все, мир познан, больше изучать и скармливать ИИ нечего? Быстро однако...

Войдите или зарегистрируйтесь, чтобы отправлять комментарии

(6 лет 3 месяца)19:47-13/Ноя/24

так всё уже изучили и изобрели, осталось со всеми болезнями человека разобраться

Войдите или зарегистрируйтесь, чтобы отправлять комментарии

(9 лет 6 месяцев)19:56-13/Ноя/24

Разобраться - и грохнуть, как это в первом Терминаторе показано

Войдите или зарегистрируйтесь, чтобы отправлять комментарии

(12 лет 6 дней)18:37-13/Ноя/24

Я совсем не специалист, поэтому вопрос дилетанта. Сегодня попалась статья, типа про самопознание ИИ. Вопрос от меня - не направить ли его на познание собственных выводов? Типа, как же я умудрился такую чушь сморозить, что кожаный мешок ругается?

p.s. Подозреваю, ответ будет - потому что буржуины не привыкли вкладывать деньги в то, что не приносит мгновенной прибыли.

Войдите или зарегистрируйтесь, чтобы отправлять комментарии

(12 лет 10 месяцев)20:27-13/Ноя/24

Нет, ответ в том что это не ИИ, а модель машинного обучения. Она должна быть обучена человеком тем запросам, на которые она будет отвечать. Модель и так на вопросы отвечает не знаниями, что 2х2=4, а мнениями из обучения - "чаще всего 2х2 будет 4". Своего мнения у ML модели нет.

Можно переобучать модель на основе высратого ей же, но поскольку качество этой информации сомнительное - модель просто деградирует. И переобучение это ёмкий процесс, в рантайме не получится такое провернуть.

Войдите или зарегистрируйтесь, чтобы отправлять комментарии

(8 лет 8 месяцев)18:44-13/Ноя/24

один дебил попросил дебильного ИИ написать ему курсовую. Он и написал, сфальсифицировать половину данных и ссылок. Дебил не проверил. Препод тоже не проверил, потому что знает что если проверит, то должен его наказать. Написал хорошую оценку. Дебил на разость запулил в интернет или дал своим братьям по разуму. Курсовая стала гулять по интернету, иногда просто сменив название и "автор". ИИ стал на ней "учиться". В следующий раз он и его собратья сгенерируют следующую курсовую беря оттуда данных, цитат и вообще. Даже антиплагиатную защиту сделают - подменят научных терминов свободным переводом на дебильском. (кстати, была такая статья о научных статей, которых учоные "писали" ИИ и там терминология умерла). И так далее, по нарастающей. Полагаю, кенийские негры (в обоих смыслах), пишущие кандидатских для занятых британских учоных теперь плачут, ИИ отнял им хлеб. Или сами скармливают ИИ своих фантазий.

Войдите или зарегистрируйтесь, чтобы отправлять комментарии

(6 лет 10 месяцев)18:46-13/Ноя/24

Ну кто бы мог предположить, что если правильно то, что ретроспективно часто, а на то, что сейчас перед пользователем в реале, то получится бредогенератор?!

Это же совершенно непредсказуемо!

Войдите или зарегистрируйтесь, чтобы отправлять комментарии

(9 лет 6 месяцев)19:57-13/Ноя/24

"Никогда такого не было, и вдруг - опять!" (с) ЧВС

Войдите или зарегистрируйтесь, чтобы отправлять комментарии

(6 лет 10 месяцев)20:02-13/Ноя/24

Войдите или зарегистрируйтесь, чтобы отправлять комментарии

Скрытый комментарий (без обсуждения)

(54 года 11 месяцев)19:49-13/Ноя/24

Перспективный чат детектед! Сим повелеваю - внести запись в реестр самых обсуждаемых за последние 4 часа.

Войдите или зарегистрируйтесь, чтобы отправлять комментарии

(9 лет 2 месяца)19:59-13/Ноя/24

Дешевые (простые) пути - всегда маркетинг и фуфло / развод лохов / имитация.

У имитации есть предел роста / совершенства.

Мошенники жалуются что разводить лохов все сложнее.

Если некомпетентны и ищут оправдания, то давай до свиданья.

Уступите дорогу компетентным и не гребите все деньги под себя.

Войдите или зарегистрируйтесь, чтобы отправлять комментарии

(8 лет 8 месяцев)20:43-13/Ноя/24

"начались проблемы с созданием новых моделей ИИ из-за нехватки качественных данных".

Так он даже от 50г откажется, я уж про застолья не говорю. Так и останется неучем с вытекающими мозгами.

Войдите или зарегистрируйтесь, чтобы отправлять комментарии

(1 год 11 месяцев)22:49-13/Ноя/24

Данных !!

Я хренею с этих додиков фестивальных.

Войдите или зарегистрируйтесь, чтобы отправлять комментарии

(8 лет 4 дня)23:01-13/Ноя/24

Я уже спрогнозировал выход на плато технологии. Никакой технологической сингулярности мы так и не достигли.

Войдите или зарегистрируйтесь, чтобы отправлять комментарии

(2 года 8 месяцев)23:37-13/Ноя/24

В переводе на человеческий: сначала умным людям предлагается создать библиотеку однозначно правильных решений (задешево), а потом гугл-жпт на ее основе облагодетельствует идиотов.

P.S. ИМХО начинается атака на акции раздутых ит-гигантов. Вдруг все познали истину.

Войдите или зарегистрируйтесь, чтобы отправлять комментарии

(11 лет 1 неделя)09:29-14/Ноя/24

Как создать нейросеть иммитирующую человека? Про датасет.

11 минут

237 прочтений

9 декабря 2023

Приветствую! Существует устоявшееся мнение о том, что нейросеть - это прежде всего датасет, на котором происходит её обучение. Следовательно, чтобы обучить нейросеть способную имитировать некоего определённого персонажа необходимо иметь датасет, представляющий из себя чат с этим персонажем.

Данная публикация является первой частью описания проекта над которым я работал, и в ней мы поговорим о том как при помощи больших языковых моделей (Large Language Models, LLM) можно создавать синтетические датасеты типа чат для обучения моделей чат-ботов имитаторов виртуальных персонажей.

Героем текущей работы стал человек по имени Иван Яковлевич Яковлев, в своё время он был выдающимся историческим деятелем, педагогом и автором современного чувашского алфавита, за подробностями перенаправляю вас в Яндекс поиск, ну а мы продолжим.

Публикация построена следующим образом: в первой половине мы с вами поговорим о мотивации, затем проанализируем некоторые существующие реализации и смежные решения, а под занавес рассмотрим ту реализацию, что сделал я.

Кстати, ранее в публикации "Про датасеты для обучения языковых ИИ моделей" я рассказывал про основные виды различных датасетов, возможно вам будут интересны мои размышления на эту тему.

Ну а тем кому не терпится изучить исходники вот ссылка на проект: character-ai

Ну и далее по тесту здесь, кому интересно
https://dzen.ru/a/ZVa8irNpxHT5Ooqy

Войдите или зарегистрируйтесь, чтобы отправлять комментарии

(11 лет 1 неделя)09:31-14/Ноя/24

И вот тема «

ИИ в каждый дом! Тонкая настройка ruGPT-3.5 при помощи LoRA

5 минут

279 прочтений

9 октября 2023

Приветствую вас мои уважаемые читатели!

В данной публикации я бы хотел в слегка облегчённой форме пересказать то о чём рассказывал в Дообучение ruGPT-3.5 13B с LoRA на Хабре....»

https://dzen.ru/a/ZSQdsoHZvgOu0Cc0

Войдите или зарегистрируйтесь, чтобы отправлять комментарии

У Google и OpenAI трудности с развитием ИИ

У американских компаний Google, OpenAI и Anthropic начались проблемы с созданием новых моделей ИИ из-за нехватки качественных данных, сообщили источники.

Комментарии

Как создать нейросеть иммитирующую человека? Про датасет.

ИИ в каждый дом! Тонкая настройка ruGPT-3.5 при помощи LoRA