Anthropic: уже сегодня ИИ способна заменить научного работника, разработчика софта и разработчика биол.оружия

12.1K 11:56 - 7/Мар/25 Россия

(10 лет 7 месяцев)

"Искусственный интеллект - это будущее не только России, это будущее всего человечества. Здесь колоссальные возможности и трудно прогнозируемые сегодня угрозы"

В.В. Путин

Запрос на регуляцию AI-индустрии от Anthropic, отправлен напрямую в Белый дом США:

Anthropic ожидает, что сверхмощные системы искусственного интеллекта уровня «страна гениев в дата-центре» (так и написано) появятся уже к концу 2026 (!) — 2027 годов. В письме в Белый дом компания призывает срочно принять меры, чтобы США сохранили лидерство и защитили критически важные технологии от конкурентов, прежде всего от Китая.

Интересные факты из обращения Anthropic:

• Уже сегодня модель Claude 3.7 Sonnet способна на уровне экспертов поддерживать сложнейшие задачи, включая написание софта, научные исследования и даже аспекты разработки биологического оружия, что подтверждено совместными тестами с институтами безопасности США и Великобритании

• Anthropic предупреждает, что новейшие китайские модели, такие как DeepSeek R1, свободно распространяются онлайн и отвечают даже на явно опасные вопросы, что подчёркивает необходимость ужесточения мер безопасности

• Компания предлагает установить особый экспортный контроль на чипы (например, новейший H200), которые могут помочь Китаю обойти действующие ограничения и догнать американские достижения в области ИИ

• Anthropic подчёркивает, что к 2027 году одна только тренировка одной ИИ-модели будет требовать до 5 гигаватт электроэнергии, что может вынудить компании переносить разработки за границу, если США не увеличат энергомощности

• Компания рекомендует Белому дому внедрять ИИ буквально во все сферы госуправления, где происходит обработка данных (тексты, изображения, аудио и видео), что может существенно повысить эффективность госаппарата

Еще Anthropic запустила собственный экономический индекс (Anthropic Economic Index), чтобы отслеживать, как искусственный интеллект меняет экономику и рынок труда США.

Оригинал письма в Белый дом: https://www.anthropic.com/news/anthropic-s-recommendations-ostp-u-s-ai-action-plan

Авторство:

Копия чужих материалов

Использованные источники:

Телеграм-канал

Комментарий автора:

Любопытно активное отрицание действительности комментаторами. Хочется верить что это живое мнение людей, а не чья-то целенаправленная дискредитация современных тенденций развития в России.

Комментарий редакции раздела Альтернативный Интеллект

Касательно "ИИ способна заменить научного работника, разработчика софта и разработчика биол.оружия" - очень хотелось бы увидеть примеры. Именно полной замены, а не выступления ИИ в роли подмастерья-подавана.

А вот касательно " если США не увеличат энергомощности" - это да, чутка посерьезнее. Давят всячески на народ, дабы стартовать ГО-ЭЛ-USA, ибо тамошная энергетика сегодня всё чаще пахнет паленым...

Продолжаем наблюдать.

@Публицистика и обсуждения#Мнение#Прогнозы @Социальная инфраструктура#IT-технологии#Наука @Статистика#Текущие данные#Исторические тренды

@Лидеры обсуждений#Перспективный чат#Хороший, годный чат

Блог пользователя SAMOKILLER | Войдите или зарегистрируйтесь, чтобы отправлять комментарии

Создатели утверждают, что в Claude 3.7 Sonnet заметно снижен уровень галлюцинаций и неточностей в ответах, а понимание контекста, напротив, повышено, даже со сложными инструкциями. Например, в симуляции взаимодействия с пользователями и внешними API (TAU-Bench) его результат составил 81,2% против 73,5% у модели o1 от OpenAI. А в оценке решения реальных задач программирования (SWE-Bench) новая разработка Anthropic продемонстрировала точность в 62,3%. Для сравнения — у версии OpenAI o3-mini этот показатель 49.3%.

https://www.kommersant.ru/doc/7535134

Войдите или зарегистрируйтесь, чтобы отправлять комментарии

(2 года 11 месяцев)12:03-7/Мар/25

Название компании нужно поменять с Anthropic на CptObvious. Капитан Очевидность, мля.

Войдите или зарегистрируйтесь, чтобы отправлять комментарии

(2 года 8 месяцев)13:21-7/Мар/25

Их Claude 3.7 действительно мощная вещь, пользуем в кодинге, прям на 2 головы выше всех аналогов что пробовали. В нашем новом проекте уже 80% кода написано этой LLM, работает как часики, что надо переписывает с ноля, что надо оптимизирует на порядки и т.п.

Сэкономили сотни человекочасов буквально за 3 недели.

Но... надо уметь с этим обращаться грамотно.

Войдите или зарегистрируйтесь, чтобы отправлять комментарии

(10 лет 2 месяца)13:37-7/Мар/25

ну такое... лучше в чем-то, если коротко, уровень кодинга "джун с одной рукой".

80% кода написано LLM... вот вы как такое посчитали по символьно или от балды?

Оптимизирует все еще плохо, рефачит плохо, создает что-то новой еще хуже. Да, круто видит большой контекст. Да может взять на себя рутину, но если есть кому проверить это и если вас устраивает "тяп-ляп и в продакшен" то да.

Раньше были индусы теперь такие вот 80% написано LLM. Без обид, ваш код не видел, ваш проект не знаю, тенденция и другие проекты.

Войдите или зарегистрируйтесь, чтобы отправлять комментарии

(8 лет 1 неделя)16:36-7/Мар/25

Ага. Суппорт будет сводиться к запросу "Перепиши всё" так как фиксить в этом невозможно :)

Войдите или зарегистрируйтесь, чтобы отправлять комментарии

(6 лет 5 месяцев)14:45-7/Мар/25

Читал недавно свежее исследование, Claude лучше всего пишет код на python и java, причем на java более надёжный, понятный и поддерживаемый код получается, с минимальным количеством потенциальных проблем на уровне рантайма.

Войдите или зарегистрируйтесь, чтобы отправлять комментарии

(2 года 8 месяцев)15:29-7/Мар/25

Вот вот, только хотел это отметить. Лучше всего кодит именно на наиболее популярных языках. Собственно под питон и JS его и пользуем.

Войдите или зарегистрируйтесь, чтобы отправлять комментарии

(8 лет 1 неделя)16:37-7/Мар/25

Ну так GC + нет указателей. Всё проще.

Войдите или зарегистрируйтесь, чтобы отправлять комментарии

(8 лет 12 месяцев)10:00-10/Мар/25

Попробуйте посмотреть на такой подход в перспективе хотя бы лет 20, где вы предполагаете брать квалифицированные кадры? Как обучать людей? Делаются любые попытки упростить процесс разработки кроме как обучение людей, это тупиковая ветка. Да и плиточника с каменщиком нервные сети никогда не заменят, как и посудомоек, дворников, парикмахеров и т.д.

Войдите или зарегистрируйтесь, чтобы отправлять комментарии

(2 года 8 месяцев)16:38-10/Мар/25

Знаете, 100 с лишним лет назад футурологи смотрели на перспективу +20 лет и заверяли всех, что крупные города мира потопнут в лошадином навозе.

У страха глаза велики.

Войдите или зарегистрируйтесь, чтобы отправлять комментарии

(8 лет 12 месяцев)16:48-10/Мар/25

При таком подходе нас ждёт идиократия через не смотрите наверх, впрочем, стадия не смотрите наверх уже наступила.

Войдите или зарегистрируйтесь, чтобы отправлять комментарии

(2 года 8 месяцев)16:55-10/Мар/25

Я смотрю на вещи трезво и с оптимизмом. И категорически против подхода "Не смотрите наверх" (фильм, кстати, шикарнейший).

Есть большая вероятность серьезной геоклиматической катастрофы в этом веке (которая совершенно НЕ связана с человеческой деятельностью, обычные циклические планетарные процессы) - так что не переживайте, облениться человечеству не дадут :) Всё будет чудесно.

Что касается обучения людей и скилов в целом. Смотрите, взгляд практика: я в своей работе задействовал Claude 3.7 для кодинга. Стал ли я от этого меньше работать? Ничуть! Но теперь я имею гораздо больше возможности концентрироваться на более стратегических, архитектурных задачах. Стал ли я тупеть? Вопрос сложный, но Claude в некотором смысле "обучает" меня, показывая новые подходы, о которых раньше не знал - и банально не было времени этому учиться, т.к. нельзя объять всё-всё. Исчезнут ли кадры с квалификацией? Посмотрим. Я не стал бы рассуждать так категорично как Вы.

В конце концов - вот скажем автоматические мельницы стали заменять труд мукомолов. Те мукомолы что были раньше, исчезли как вид и больше не найти сего специалиста. Внимание, вопрос: является ли это катастрофой в ключе вселенского голода, из-за того что скилы мукомола полностью исчезли?

Войдите или зарегистрируйтесь, чтобы отправлять комментарии

(11 лет 6 месяцев)12:06-7/Мар/25

Лидерство им уже нужно не сохранять, а возвращать, но навряд-ли у них это получится по объективным причинам.

Войдите или зарегистрируйтесь, чтобы отправлять комментарии

(7 лет 4 месяца)12:09-7/Мар/25

Уже сегодня модель Claude 3.7 Sonnet способна на уровне экспертов поддерживать сложнейшие задачи, включая написание софта

Каждый раз, когда такое пишут, я задаюсь вопросом, что кручее Claude Sonnet или найденный кусок кода на github. github всё ещё выигрывает.

Интересно, почему не пишут, что "Любой код можно найти на github и он решит вашу задачу! Программисты больше не нужны!"

Войдите или зарегистрируйтесь, чтобы отправлять комментарии

(6 лет 4 месяца)12:20-7/Мар/25

так то-ж искать нужно... и да, уже больше года назад писали, что более половины нового кода на гитхабе -нагенерированный ИИ (и как следствие качество нового кода падает)

Войдите или зарегистрируйтесь, чтобы отправлять комментарии

(7 лет 4 месяца)12:33-7/Мар/25

Буквально пару дней назад я пытался при помощи deepsek написать простенький код и народ (при помощи других нейросетей).

Что-то мне даже на простых задачах качество не понравилось. Ну сделало оно ошибку 1/6+1/2-1/6=1/3, а потом ищи по всем формулам. Не очень понятно как этим пользоваться "на автомате".

Войдите или зарегистрируйтесь, чтобы отправлять комментарии

(10 лет 7 месяцев)12:37-7/Мар/25

Вот только что специально проверил. Даже отключил функцию DeepThink, чтобы побыстрее ответ получить.

Войдите или зарегистрируйтесь, чтобы отправлять комментарии

(7 лет 4 месяца)12:48-7/Мар/25

Да, но вот у меня оно не смогло сложить корректно.

Войдите или зарегистрируйтесь, чтобы отправлять комментарии

(10 лет 7 месяцев)12:51-7/Мар/25

Юзайте чатгпт o1 или o3-mini. Он решает такие вещи.

Войдите или зарегистрируйтесь, чтобы отправлять комментарии

(7 лет 4 месяца)13:18-7/Мар/25

Возможно. Времени только на всё это жалко. Пол года назад довольно активно тестировал на ollama разные модельки. Они все ошибались, и чем дальше от тестовых примеров - тем больше.

Войдите или зарегистрируйтесь, чтобы отправлять комментарии

(8 лет 12 месяцев)10:05-10/Мар/25

Когда надо преобразовывать системы дифуров порядка 3-4, то проще сделать это или в соответствующем софте или на бумаге. Куда интересней становится, когда работаешь с системами порядка так 12-15-20. Матлаб тупо затыкается, проверять результат нервной сети не представляется возможным, в итоге опять же берём в руки бумагу и ручку))

Войдите или зарегистрируйтесь, чтобы отправлять комментарии

(7 лет 6 месяцев)12:55-7/Мар/25

Любой дурак может заменить научного работника, разработчика софта и разработчика биол.оружия, а не может он сделать что-нибудь попроще, битка там намайнить по-запросу из браузера на указанный кошелёк или ещё чего полезного на бирже заработать?

Войдите или зарегистрируйтесь, чтобы отправлять комментарии

(2 года 8 месяцев)13:22-7/Мар/25

Толсто

Войдите или зарегистрируйтесь, чтобы отправлять комментарии

(7 лет 6 месяцев)13:25-7/Мар/25

Что и даже этого нет? Странно, столько уверенных песен.

Войдите или зарегистрируйтесь, чтобы отправлять комментарии

(2 года 8 месяцев)13:32-7/Мар/25

Будет 😉

Войдите или зарегистрируйтесь, чтобы отправлять комментарии

(7 лет 6 месяцев)13:51-7/Мар/25

Будет

Это присказка не сказка, сказка БУДЕТ впереди. Для начала нужно БУДЕТ найти фактическое отличие от калькулятора. Иначе какое же это ИИ, с электронным-то калькулятором, обман один. С калькулятором, да с базой данных каждый дурак может. А вот сможет он чего нибудь без баз и калькулятора?

Войдите или зарегистрируйтесь, чтобы отправлять комментарии

(7 лет 4 месяца)13:27-7/Мар/25

Нейросети, которые торгуют на бирже не выкладывают в открытый доступ. Впрочем подозреваю, что это относится ко всем нейросетям, которые могут что-то заработать.

Войдите или зарегистрируйтесь, чтобы отправлять комментарии

(7 лет 6 месяцев)13:31-7/Мар/25

А формулы биооружия выкладывают. Ну, а иначе как проверить, что он может этих учёных заменить? Ну, это если не наврать с три короба, всё равно проверить никто не сможет.

Войдите или зарегистрируйтесь, чтобы отправлять комментарии

(2 года 9 месяцев)14:37-7/Мар/25

Дел.

Войдите или зарегистрируйтесь, чтобы отправлять комментарии

(2 года 9 месяцев)14:44-7/Мар/25

Ну сделало оно ошибку 1/6+1/2-1/6=1/3

LLM пока плохо умеют в математику! И никогда не умели хорошо.

Это всем понятно.

Зачем вы выдаёте это с таким удивлением? Вы точно сам разработчик?

Кажется, что нет.

Войдите или зарегистрируйтесь, чтобы отправлять комментарии

(6 лет 4 месяца)19:46-7/Мар/25

Так и не пользуйся этими джуноимитаторами

Войдите или зарегистрируйтесь, чтобы отправлять комментарии

(1 год 10 месяцев)12:45-7/Мар/25

вся надежда на StackOverflow ;)

Войдите или зарегистрируйтесь, чтобы отправлять комментарии

(3 года 2 недели)13:37-7/Мар/25

Аминь.

Войдите или зарегистрируйтесь, чтобы отправлять комментарии

(6 лет 4 месяца)19:45-7/Мар/25

Никакой надежды кроме как на свои мозги

Войдите или зарегистрируйтесь, чтобы отправлять комментарии

(10 лет 2 месяца)13:40-7/Мар/25

ну вот тоже скажете... а как же бабло? обучить модель лярд* минимум, тут такой простор для фантазий )

*(да китайцы смогли за 60лямов, но у них и километры больше в электромашинах если вы понимаете о чем я )

Войдите или зарегистрируйтесь, чтобы отправлять комментарии

(7 лет 5 месяцев)13:40-7/Мар/25

вы таки хочете видеть правду? в виде текста - (типа так) Claude 3.7 Sonnet способна на уровне экспертов найти кусок кода на github и он решит вашу задачу!

Ну кто ж нынче антирекламой занимается? Не выгодно .. наверно?

Войдите или зарегистрируйтесь, чтобы отправлять комментарии

(7 лет 4 месяца)13:44-7/Мар/25

В таком качестве я нейросетки использую, отлично работает!

Войдите или зарегистрируйтесь, чтобы отправлять комментарии

(10 лет 7 месяцев)13:52-7/Мар/25

А какие сетки и какие промпты?

Войдите или зарегистрируйтесь, чтобы отправлять комментарии

(7 лет 4 месяца)15:10-7/Мар/25

У меня всё очень казуально. К примеру попросил недавно deepseek написать функцию alpha blending-a на cuda для pytorch. Он мне сразу выдал рабочую функцию. Найти что-то подобное поиском с интернете сложно, т.к. это зарыто где-то глубоко на форумах nvidia которые поисковики неохотно индексируют.

Сейчас кстати достаточно большие проблемы с поисковиками. Т.е. даже если google попросить найти код по куску исходного кода (полностью идентичному тому, что надо найти), то он это сделать не сможет. Даже если явно указать, что искать надо на github.

Войдите или зарегистрируйтесь, чтобы отправлять комментарии

(8 лет 12 месяцев)10:12-10/Мар/25

Он мне сразу выдал рабочую функцию.

Предполагаю, что вы обладаете квалификацией, что бы это понять.

Я тут недавно фильтр Калмана настраивал, внешне всё работало, оценки сходятся, но иногда буд-то что-то не так. Ошибку нашел в итоге, она не то, что бы самая тривиальная, и нифига не очевидная. Система тут относительно простая, два десятка стохастических дифуров, хотелось бы посмотреть, как тут нервная сеть справится. Мы как-то, по приколу, спрашивали, она сказала, что надо взяять ФК и настроить его, на вопрос как его настраивать она сказала что-то вроде надо подобрать такие параметры, которые обеспечат наилучший результат.

Войдите или зарегистрируйтесь, чтобы отправлять комментарии

(7 лет 4 месяца)10:42-10/Мар/25

Предполагаю, что вы обладаете квалификацией, что бы это понять.

Там было довольно смешно с этой функцией. Она была нужна разработчику нейросетей из computer vision. Но современные разработчики нейросетей "срезают углы". Т.е. они знают куда что тыкнуть, какую высокоуровневую функцию на python вызвать и делают это довольно успешно. Но достаточно слабо знают теорию, а про то, что можно написать какую-то свою функцию для pytorch (даже простейшую) не думают. Не их это уровень.

Ошибку нашел в итоге

Если честно, я не особо умею пользоваться нейросетями. Когда знаю ответ, тогда могу написать промт для нейросети. Когда ответа не знаю - то не могу.

Войдите или зарегистрируйтесь, чтобы отправлять комментарии

(8 лет 12 месяцев)11:35-10/Мар/25

Когда знаю ответ, тогда могу написать промт для нейросети. Когда ответа не знаю - то не могу.

Воот, ключевой момент! Собственно такое применение нервной сети мне вполне понятно, чистое экономие времени, полностью согласен, вот только в реальности всё несколько иначе, к сожалению.

Но достаточно слабо знают теорию, а про то, что можно написать какую-то свою функцию для pytorch (даже простейшую) не думают. Не их это уровень.

Сталкиваюсь с таким постоянно в процессе обучения, и далеко не всегда могу дать содержательный ответ, для чего надо знать, как кватернионное умножение изоморфно матричному произведению, например, благо есть соответствующие темы на том же хабре, где люди упарываются в производительность. Нет, сам-то я понимаю как и для чего надо знать теорию, но передать свой опыт другому человеку могут не только лишь все.

Войдите или зарегистрируйтесь, чтобы отправлять комментарии

(7 лет 5 месяцев)14:09-7/Мар/25

Ну как обучите, так и работают.. каков учитель, таков и результат...

..а так то студенты уже прикалываются - сходу видно кто код писал.. чел "без употребления граматики", или ....- всё причёсано и одеколоном пахнет))

Войдите или зарегистрируйтесь, чтобы отправлять комментарии

(6 лет 11 месяцев)16:52-7/Мар/25

Да пусть себе...

Я просто точно знаю, что 80% моих повседневных задач ни один бредогенератор не выполнит.

Ни сегодня, ни через 25 лет.

Войдите или зарегистрируйтесь, чтобы отправлять комментарии

(11 лет 3 недели)07:52-8/Мар/25

Дык эта модель там для вас это и ищет:))

Войдите или зарегистрируйтесь, чтобы отправлять комментарии

(6 лет 9 месяцев)12:10-7/Мар/25

Флаг в руки, барабан на шею, паровоз навстречу.

Как набивший шишек много лет назад, прокомментирую - постановка задачи = 60% решения. Если хватает интеллекта поставить задачу, то уж код отписать - уж как-нибудь....

Войдите или зарегистрируйтесь, чтобы отправлять комментарии

(13 лет 2 месяца)12:34-7/Мар/25

Про постановку задачи - полностью согласен.

Тогда должны остаться middle + и выше, а различные стажеры и junior должны сократиться (во всех областях, не только IT). А вот когда спецы постареют, а новых не будет, т.к. порог входа будет большой, начнется интересное.

Войдите или зарегистрируйтесь, чтобы отправлять комментарии

(2 года 8 месяцев)13:25-7/Мар/25

Так постановка задачи правильно это само собой разумеющаяся основа, это и так очевидно. И правильный ТЗ нужно грамотно составлять как человеку, так и LLM. Разница лишь в том, что человек будет кодить и отлаживать неделю, а Claude 3.7 строчит тот же объем кода за пару минут. И точно так же быстро всё переписывает с нуля (или заданные участки), либо же оптимизирует если поставлена такая задача. Нам уже сэкономил сотни человекочасов буквально за пару недель.

Войдите или зарегистрируйтесь, чтобы отправлять комментарии

(3 года 2 недели)13:39-7/Мар/25

Извините а можно в общих чертах обрисовать что за проект?

Войдите или зарегистрируйтесь, чтобы отправлять комментарии

Anthropic: уже сегодня ИИ способна заменить научного работника, разработчика софта и разработчика биол.оружия

Комментарии

Страницы