Anthropic: уже сегодня ИИ способна заменить научного работника, разработчика софта и разработчика биол.оружия

Аватар пользователя SAMOKILLER

"Искусственный интеллект - это будущее не только России, это будущее всего человечества. Здесь колоссальные возможности и трудно прогнозируемые сегодня угрозы"

В.В. Путин

Запрос на регуляцию AI-индустрии от Anthropic, отправлен напрямую в Белый дом США:

Anthropic ожидает, что сверхмощные системы искусственного интеллекта уровня «страна гениев в дата-центре» (так и написано) появятся уже к концу 2026 (!) — 2027 годов. В письме в Белый дом компания призывает срочно принять меры, чтобы США сохранили лидерство и защитили критически важные технологии от конкурентов, прежде всего от Китая.

Интересные факты из обращения Anthropic:

• Уже сегодня модель Claude 3.7 Sonnet способна на уровне экспертов поддерживать сложнейшие задачи, включая написание софта, научные исследования и даже аспекты разработки биологического оружия, что подтверждено совместными тестами с институтами безопасности США и Великобритании

• Anthropic предупреждает, что новейшие китайские модели, такие как DeepSeek R1, свободно распространяются онлайн и отвечают даже на явно опасные вопросы, что подчёркивает необходимость ужесточения мер безопасности

• Компания предлагает установить особый экспортный контроль на чипы (например, новейший H200), которые могут помочь Китаю обойти действующие ограничения и догнать американские достижения в области ИИ

• Anthropic подчёркивает, что к 2027 году одна только тренировка одной ИИ-модели будет требовать до 5 гигаватт электроэнергии, что может вынудить компании переносить разработки за границу, если США не увеличат энергомощности

• Компания рекомендует Белому дому внедрять ИИ буквально во все сферы госуправления, где происходит обработка данных (тексты, изображения, аудио и видео), что может существенно повысить эффективность госаппарата

Еще Anthropic запустила собственный экономический индекс (Anthropic Economic Index), чтобы отслеживать, как искусственный интеллект меняет экономику и рынок труда США.

Оригинал письма в Белый дом: https://www.anthropic.com/news/anthropic-s-recommendations-ostp-u-s-ai-action-plan

Авторство: 
Копия чужих материалов
Комментарий автора: 

Любопытно активное отрицание действительности комментаторами. Хочется верить что это живое мнение людей, а не чья-то целенаправленная дискредитация современных тенденций развития в России.

Комментарий редакции раздела Альтернативный Интеллект

Касательно "ИИ способна заменить научного работника, разработчика софта и разработчика биол.оружия" - очень хотелось бы увидеть примеры. Именно полной замены, а не выступления ИИ в роли подмастерья-подавана.

А вот касательно " если США не увеличат энергомощности" - это да, чутка посерьезнее. Давят всячески на народ, дабы стартовать ГО-ЭЛ-USA, ибо тамошная энергетика сегодня всё чаще пахнет паленым...

Продолжаем наблюдать.

Комментарии

Аватар пользователя Langeo
Langeo(10 лет 1 месяц)

Ну удачи. Только потом заменители пусть не плачут.

Аватар пользователя Vanov
Vanov(4 года 10 месяцев)

Создатели утверждают, что в Claude 3.7 Sonnet заметно снижен уровень галлюцинаций и неточностей в ответах, а понимание контекста, напротив, повышено, даже со сложными инструкциями. Например, в симуляции взаимодействия с пользователями и внешними API (TAU-Bench) его результат составил 81,2% против 73,5% у модели o1 от OpenAI. А в оценке решения реальных задач программирования (SWE-Bench) новая разработка Anthropic продемонстрировала точность в 62,3%. Для сравнения — у версии OpenAI o3-mini этот показатель 49.3%.

https://www.kommersant.ru/doc/7535134

Аватар пользователя Smart75
Smart75(2 года 11 месяцев)

smile445.gifsmile445.gifsmile445.gif

Название компании нужно поменять с Anthropic на CptObvious. Капитан Очевидность, мля.

Аватар пользователя Shulz
Shulz(2 года 8 месяцев)

Их Claude 3.7 действительно мощная вещь, пользуем в кодинге, прям на 2 головы выше всех аналогов что пробовали. В нашем новом проекте уже 80% кода написано этой LLM, работает как часики, что надо переписывает с ноля, что надо оптимизирует на порядки и т.п.

Сэкономили сотни человекочасов буквально за 3 недели. 

Но... надо уметь с этим обращаться грамотно.

Аватар пользователя Профаныч
Профаныч(10 лет 2 месяца)

ну такое... лучше  в чем-то, если коротко, уровень кодинга "джун с одной рукой".

80% кода написано LLM... вот вы как такое посчитали по символьно или от балды? 

Оптимизирует все еще плохо, рефачит плохо, создает что-то новой еще хуже. Да, круто видит большой контекст. Да может взять на себя рутину, но если есть кому проверить это и если вас устраивает  "тяп-ляп и в продакшен" то да.

Раньше были индусы теперь такие вот 80% написано LLM. Без обид, ваш код не видел, ваш проект не знаю, тенденция и другие проекты.

Аватар пользователя Дядя Миша
Дядя Миша(8 лет 1 неделя)

Ага. Суппорт будет сводиться к запросу "Перепиши всё" так как фиксить в этом невозможно :)

Аватар пользователя MAGNUS8
MAGNUS8(6 лет 5 месяцев)

Читал недавно свежее исследование, Claude лучше всего пишет код на python и java, причем на java более надёжный, понятный и поддерживаемый код получается, с минимальным количеством потенциальных проблем на уровне рантайма.

Аватар пользователя Shulz
Shulz(2 года 8 месяцев)

Вот вот, только хотел это отметить. Лучше всего кодит именно на наиболее популярных языках. Собственно под питон и JS его и пользуем.

Аватар пользователя Дядя Миша
Дядя Миша(8 лет 1 неделя)

Ну так GC + нет указателей. Всё проще.

Аватар пользователя Canis_m
Canis_m(8 лет 12 месяцев)

Попробуйте посмотреть на такой подход в перспективе хотя бы лет 20, где вы предполагаете брать квалифицированные кадры? Как обучать людей? Делаются любые попытки упростить процесс разработки кроме как обучение людей, это тупиковая ветка. Да и плиточника с каменщиком нервные сети никогда не заменят, как и посудомоек, дворников, парикмахеров и т.д.

Аватар пользователя Shulz
Shulz(2 года 8 месяцев)

Знаете, 100 с лишним лет назад футурологи смотрели на перспективу +20 лет и заверяли всех, что крупные города мира потопнут в лошадином навозе.

У страха глаза велики.

Аватар пользователя Canis_m
Canis_m(8 лет 12 месяцев)

При таком подходе нас ждёт идиократия через не смотрите наверх, впрочем, стадия не смотрите наверх уже наступила.

Аватар пользователя Shulz
Shulz(2 года 8 месяцев)

Я смотрю на вещи трезво и с оптимизмом. И категорически против подхода "Не смотрите наверх" (фильм, кстати, шикарнейший).

Есть большая вероятность серьезной геоклиматической катастрофы в этом веке (которая совершенно НЕ связана с человеческой деятельностью, обычные циклические планетарные процессы) - так что не переживайте, облениться человечеству не дадут :) Всё будет чудесно.

Что касается обучения людей и скилов в целом. Смотрите, взгляд практика: я в своей работе задействовал Claude 3.7 для кодинга. Стал ли я от этого меньше работать? Ничуть! Но теперь я имею гораздо больше возможности концентрироваться на более стратегических, архитектурных задачах. Стал ли я тупеть? Вопрос сложный, но Claude в некотором смысле "обучает" меня, показывая новые подходы, о которых раньше не знал - и банально не было времени этому учиться, т.к. нельзя объять всё-всё. Исчезнут ли кадры с квалификацией? Посмотрим. Я не стал бы рассуждать так категорично как Вы.

В конце концов - вот скажем автоматические мельницы стали заменять труд мукомолов. Те мукомолы что были раньше, исчезли как вид и больше не найти сего специалиста. Внимание, вопрос: является ли это катастрофой в ключе вселенского голода, из-за того что скилы мукомола полностью исчезли?

Аватар пользователя zebraptor
zebraptor(11 лет 6 месяцев)

Лидерство им уже нужно не сохранять, а возвращать, но навряд-ли у них это получится по объективным причинам.

Аватар пользователя balmer
balmer(7 лет 4 месяца)

Уже сегодня модель Claude 3.7 Sonnet способна на уровне экспертов поддерживать сложнейшие задачи, включая написание софта

Каждый раз, когда такое пишут, я задаюсь вопросом, что кручее Claude Sonnet или найденный кусок кода на github. github всё ещё выигрывает.

Интересно, почему не пишут, что "Любой код можно найти на github и он решит вашу задачу! Программисты больше не нужны!"

Аватар пользователя Escander
Escander(6 лет 4 месяца)

так то-ж искать нужно... и да, уже больше года назад писали, что более половины нового кода на гитхабе -нагенерированный ИИ (и как следствие качество нового кода падает)

Аватар пользователя balmer
balmer(7 лет 4 месяца)

Буквально пару дней назад я пытался при помощи deepsek написать простенький код и народ (при помощи других нейросетей).

Что-то мне даже на простых задачах качество не понравилось. Ну сделало оно ошибку 1/6+1/2-1/6=1/3, а потом ищи по всем формулам. Не очень понятно как этим пользоваться "на автомате".

Аватар пользователя SAMOKILLER
SAMOKILLER(10 лет 7 месяцев)

Вот только что специально проверил. Даже отключил функцию DeepThink, чтобы побыстрее ответ получить.

Аватар пользователя balmer
balmer(7 лет 4 месяца)

Да, но вот у меня оно не смогло сложить корректно.

Аватар пользователя SAMOKILLER
SAMOKILLER(10 лет 7 месяцев)

Юзайте чатгпт o1 или o3-mini. Он решает такие вещи.

Аватар пользователя balmer
balmer(7 лет 4 месяца)

Возможно. Времени только на всё это жалко. Пол года назад довольно активно тестировал на ollama разные модельки. Они все ошибались, и чем дальше от тестовых примеров - тем больше.

Аватар пользователя Canis_m
Canis_m(8 лет 12 месяцев)

Когда надо преобразовывать системы дифуров порядка 3-4, то проще сделать это или в соответствующем софте или на бумаге. Куда интересней становится, когда работаешь с системами порядка так 12-15-20. Матлаб тупо затыкается, проверять результат нервной сети не представляется возможным, в итоге опять же берём в руки бумагу и ручку))

Аватар пользователя zonder
zonder(7 лет 6 месяцев)

Любой дурак может заменить научного работника, разработчика софта и разработчика биол.оружия, а не может он сделать что-нибудь попроще, битка там намайнить по-запросу из браузера на указанный кошелёк или ещё чего полезного на бирже заработать?

Аватар пользователя Shulz
Shulz(2 года 8 месяцев)

Толсто

Аватар пользователя zonder
zonder(7 лет 6 месяцев)

Что и даже этого нет? Странно, столько уверенных песен.

Аватар пользователя Shulz
Shulz(2 года 8 месяцев)

Будет 😉

Аватар пользователя zonder
zonder(7 лет 6 месяцев)

Будет

Это присказка не сказка, сказка БУДЕТ впереди. Для начала нужно БУДЕТ найти фактическое отличие от калькулятора. Иначе какое же это ИИ, с электронным-то калькулятором, обман один. С калькулятором, да с базой данных каждый дурак может. А вот сможет он чего нибудь без баз и калькулятора? 

Аватар пользователя balmer
balmer(7 лет 4 месяца)

Нейросети, которые торгуют на бирже не выкладывают в открытый доступ. Впрочем подозреваю, что это относится ко всем нейросетям, которые могут что-то заработать.

Аватар пользователя zonder
zonder(7 лет 6 месяцев)

А формулы биооружия выкладывают. Ну, а иначе как проверить, что он может этих учёных заменить? Ну, это если не наврать с три короба, всё равно проверить никто не сможет.

Аватар пользователя Ритор
Ритор(2 года 9 месяцев)

Дел.

Аватар пользователя Ритор
Ритор(2 года 9 месяцев)

 Ну сделало оно ошибку 1/6+1/2-1/6=1/3

LLM пока плохо умеют в математику! И никогда не умели хорошо.

Это всем понятно.

Зачем вы выдаёте это с таким удивлением? Вы точно сам разработчик?

Кажется, что нет.

Аватар пользователя Escander
Escander(6 лет 4 месяца)

Так и не пользуйся этими джуноимитаторами

Аватар пользователя Pablo666
Pablo666(1 год 10 месяцев)

вся надежда на  StackOverflow ;)

Аватар пользователя Органика
Органика(3 года 2 недели)

Аминь.

Аватар пользователя Escander
Escander(6 лет 4 месяца)

Никакой надежды кроме как на свои мозги

Аватар пользователя Профаныч
Профаныч(10 лет 2 месяца)

ну вот тоже скажете... а как же бабло? обучить модель лярд* минимум, тут такой простор для фантазий )

*(да китайцы смогли за 60лямов, но у них и километры больше в электромашинах если вы понимаете о чем я ) 

Аватар пользователя Вов
Вов(7 лет 5 месяцев)

вы таки хочете видеть правду? в виде текста - (типа так) Claude 3.7 Sonnet способна на уровне экспертов найти кусок кода на github и он решит вашу задачу!

 Ну кто ж нынче антирекламой занимается? Не выгодно .. наверно?

Аватар пользователя balmer
balmer(7 лет 4 месяца)

В таком качестве я нейросетки использую, отлично работает!

Аватар пользователя SAMOKILLER
SAMOKILLER(10 лет 7 месяцев)

А какие сетки и какие промпты?

Аватар пользователя balmer
balmer(7 лет 4 месяца)

У меня всё очень казуально. К примеру попросил недавно deepseek написать функцию alpha blending-a на cuda для pytorch. Он мне сразу выдал рабочую функцию. Найти что-то подобное поиском с интернете сложно, т.к. это зарыто где-то глубоко на форумах nvidia которые поисковики неохотно индексируют.

Сейчас кстати достаточно большие проблемы с поисковиками. Т.е. даже если google попросить найти код по куску исходного кода (полностью идентичному тому, что надо найти), то он это сделать не сможет. Даже если явно указать, что искать надо на github.

Аватар пользователя Canis_m
Canis_m(8 лет 12 месяцев)

Он мне сразу выдал рабочую функцию.

Предполагаю, что вы обладаете квалификацией, что бы это понять.

Я тут недавно фильтр Калмана настраивал, внешне всё работало, оценки сходятся, но иногда буд-то что-то не так. Ошибку нашел в итоге, она не то, что бы самая тривиальная, и нифига не очевидная. Система тут относительно простая, два десятка стохастических дифуров, хотелось бы посмотреть, как тут нервная сеть справится. Мы как-то, по приколу, спрашивали, она сказала, что надо взяять ФК и настроить его, на вопрос как его настраивать она сказала что-то вроде надо подобрать такие параметры, которые обеспечат наилучший результат.

Аватар пользователя balmer
balmer(7 лет 4 месяца)

Предполагаю, что вы обладаете квалификацией, что бы это понять.

Там было довольно смешно с этой функцией. Она была нужна разработчику нейросетей из computer vision. Но современные разработчики нейросетей "срезают углы". Т.е. они знают куда что тыкнуть, какую высокоуровневую функцию на python вызвать и делают это довольно успешно. Но достаточно слабо знают теорию, а про то, что можно написать какую-то свою функцию для pytorch (даже простейшую) не думают. Не их это уровень.

Ошибку нашел в итоге

Если честно, я не особо умею пользоваться нейросетями. Когда знаю ответ, тогда могу написать промт для нейросети. Когда ответа не знаю - то не могу.

Аватар пользователя Canis_m
Canis_m(8 лет 12 месяцев)

Когда знаю ответ, тогда могу написать промт для нейросети. Когда ответа не знаю - то не могу.

Воот, ключевой момент! Собственно такое применение нервной сети мне вполне понятно, чистое экономие времени, полностью согласен, вот только в реальности всё несколько иначе, к сожалению.

Но достаточно слабо знают теорию, а про то, что можно написать какую-​то свою функцию для pytorch (даже простейшую) не думают. Не их это уровень.

Сталкиваюсь с таким постоянно в процессе обучения, и далеко не всегда могу дать содержательный ответ, для чего надо знать, как кватернионное умножение изоморфно матричному произведению, например, благо есть соответствующие темы на том же хабре, где люди упарываются в производительность. Нет, сам-то я понимаю как и для чего надо знать теорию, но передать свой опыт другому человеку могут не только лишь все.

Аватар пользователя Вов
Вов(7 лет 5 месяцев)

Ну как обучите, так и работают.. каков учитель, таков и результат... 

 ..а так то студенты уже прикалываются - сходу видно кто код писал..  чел "без употребления граматики", или ....-  всё причёсано и одеколоном пахнет))

Аватар пользователя Steel Rat
Steel Rat(6 лет 11 месяцев)

Да пусть себе...

Я просто точно знаю, что 80% моих повседневных задач ни один бредогенератор не выполнит.

Ни сегодня, ни через 25 лет. smile29.gif

Аватар пользователя Sibirsky Partizan
Sibirsky Partizan(11 лет 3 недели)

Дык эта модель там для вас это и ищет:))

Аватар пользователя Udushyev
Udushyev(6 лет 9 месяцев)

Флаг в руки, барабан на шею, паровоз навстречу. 

Как набивший шишек много лет назад, прокомментирую - постановка задачи = 60% решения. Если хватает интеллекта поставить задачу, то уж код отписать - уж как-нибудь....

Аватар пользователя petr7070
petr7070(13 лет 2 месяца)

Про постановку задачи - полностью согласен. 

Тогда должны остаться middle + и выше, а различные стажеры и junior должны сократиться (во всех областях, не только IT). А вот когда спецы постареют, а новых не будет, т.к. порог входа будет большой, начнется интересное.

Аватар пользователя Shulz
Shulz(2 года 8 месяцев)

Так постановка задачи правильно это само собой разумеющаяся основа, это и так очевидно. И правильный ТЗ нужно грамотно составлять как человеку, так и LLM. Разница лишь в том, что человек будет кодить и отлаживать неделю, а Claude 3.7 строчит тот же объем кода за пару минут. И точно так же быстро всё переписывает с нуля (или заданные участки), либо же оптимизирует если поставлена такая задача. Нам уже сэкономил сотни человекочасов буквально за пару недель. 

Аватар пользователя Органика
Органика(3 года 2 недели)

Извините а можно в общих чертах обрисовать что за проект? 

Страницы