mastodon.world is one of the many independent Mastodon servers you can use to participate in the fediverse.
Generic Mastodon server for anyone to use.

Server stats:

8.1K
active users

#ai_agent

3 posts2 participants0 posts today

Решаем задачи международной математической олимпиады у себя на домашнем компьютере

Двое ученых из университета Лос-Анжелеса повторили результат OpenAI и Google с золотой медалью IMO, но с помощью обычной публичной Gemini 2.5 Pro. В статье я рассказал о хронологии событий июля, а также нашёл репозиторий с проектом этих учёных, так что теперь каждый может попробовать решать олимпиадные задачи у себя дома.

habr.com/ru/articles/931198/

ХабрРешаем задачи международной математической олимпиады у себя на домашнем компьютереВведение Надо сразу сказать, что кроме кибербезопасности, у меня есть ещё 2 любимых предмета - это математика и искусственный интеллект. Поэтому, хотя мой блог и посвящён кибербезу, но не написать эту...

Безопасность AI-агентов в Web3. Часть 3: Скажи мне что-нибудь, и я скажу, кто ты

AI‑агенты все чаще используются для принятия важных решений и даже управления активами на десятки миллионов долларов, встает вопрос возможности определения LLM модели по ее ответам — fingerprinting. Это нужно для анализа безопасности использования агента, о котором не известно технических деталей «черного ящика» и учета особенностей конкретных моделей, о чем мы писали в прошлых статьях ( часть 1 , часть 2 ). Также можно отслеживать изменения используемых моделей в конкретном AI‑агенте и вовремя распознать попытку подмены.

habr.com/ru/companies/pt/artic

ХабрБезопасность AI-агентов в Web3. Часть 3: Скажи мне что-нибудь, и я скажу, кто тыAI-агенты все чаще используются для принятия важных решений и даже управления активами на десятки миллионов долларов, встает вопрос возможности определения LLM модели по ее ответам - fingerprinting....

AI Software Engineering: От хаоса Vibe Coding к системной разработке с AI-агентами

В мире разработки программного обеспечения происходит фундаментальная революция. Мы стоим на пороге перелома в самом подходе к созданию кода : от традиционного программирования, где код пишется вручную, к новой эпохе, где AI-агенты становятся не просто ассистентами, а полноценными членами команды разработки. В этой статье мы исследуем эволюцию подходов к AI-разработке - от такого подхода как Vibe Coding к системной методологии AI Software Engineering (AI SWE) , которая позволяет превратить AI-агентов в управляемый инструмент для создания больших и сложных систем.

habr.com/ru/articles/934806/

ХабрAI Software Engineering: От хаоса Vibe Coding к системной разработке с AI-агентамиВведение: В мире разработки программного обеспечения происходит фундаментальная революция. Мы стоим на пороге  перелома в самом подходе к созданию кода : от традиционного программирования, где...

Консолидация памяти — или как избежать альцгеймера у LLM

Просыпаюсь утром, открываю свой чат с GPT, начинаю увлеченно обсуждать архитектуру нового проекта. Через час диалог превращается в философский трактат о смысле жизни, еще через час - в рецепт борща. И вот, когда я пытаюсь вернуться к архитектуре, модель смотрит на меня как на незнакомца: "А что за проект? Борщ, говорите?" Если очень коротко, у современных LLM есть одна маленькая проблема, они вполне страдают тем же самым “альцгеймером”, что и люди, хоть и причины немного иные (а может и нет) и это конечно не медицинский диагноз, а конкретная технологическая проблема, которое бьет не только по качеству результата, но и по нашим с вами кошелькам :) В итоге, пройдя 10 кругов ада, так и решил наконец сесть и разобраться, а почему они начинают забывать все важные детали, а также можно ли как-то удешевить таки API в подобных задачах?

habr.com/ru/articles/934390/

ХабрКонсолидация памяти — или как избежать альцгеймера у LLMПросыпаюсь утром, открываю свой чат с GPT, начинаю увлеченно обсуждать архитектуру нового проекта. Через час диалог превращается в философский трактат о смысле жизни, еще через час - в рецепт борща. И...
#llm#ai#chatgpt

Как интегрировать Google ADK с кастомным интерфейсом: пошаговое руководство с примерами

Как интегрировать Google ADK с кастомным интерфейсом: пошаговое руководство с примерами Подробный гид по интеграции Google ADK (Agent Development Kit) и Vertex AI Agent Engine в кастомные интерфейсы. В статье разобраны все ключевые этапы — от развёртывания агента до настройки стриминга, сохранения состояния (state) и построения собственной архитектуры взаимодействия с LLM. Подходит разработчикам, которые хотят быстро подключить AI-агента к своему продукту и сохранить контроль над логикой, безопасностью и пользовательским опытом.

habr.com/ru/articles/933804/

ХабрКак интегрировать Google ADK с кастомным интерфейсом: пошаговое руководство с примерамиРуководство по интеграции Google ADK в кастомный интерфейс: примеры кода, работа с сессиями, FastAPI, деплой на Vertex AI и структура агента. Всем здравствуйте! Меня зовут  Mykhailo Kapustin , я...

Стартап за выходные: AI-агент для БД, часть 2

Ну кто не мечтает запустить стартап за одни выходные? Давно хотел развеяться, и чутка отвлечься от рутины и работы. А ещё давно хотел пощупать Tauri v2, и новомодные фреймворки для построения AI-агентов ( ai-sdk / mastra / llamaindex ). Идея простая: десктопное приложение, внутри ИИ-агент, который подключается к БД, получает данные о структуре таблиц/вьюшек. Справа сайдбар: интерфейс чата с агентом, а основное пространство - холст, на котором агент размещает что хочет сам. А именно - виджеты, которые делают запросы к БД, и выводят их в приятном глазу виде. Никакого удалённого бекенда, open-source, доступы к БД хранятся исключительно локально, всё секьюрно. Часть 2 - как мы в runtime React-компоненты компилировали.

habr.com/ru/articles/931518/

ХабрСтартап за выходные: AI-агент для БД, часть 2Ну кто не мечтает запустить стартап за одни выходные? Давно хотел развеяться, и чутка отвлечься от рутины и работы. А ещё давно хотел пощупать Tauri v2, и новомодные фреймворки для построения...

Стартап за выходные: AI-агент для БД, часть 1

Ну кто не мечтает запустить стартап за одни выходные? Давно хотел развеяться, и чутка отвлечься от рутины и работы. А ещё давно хотел пощупать Tauri v2, и новомодные фреймворки для построения AI-агентов ( ai-sdk / mastra / llamaindex . Идея простая: десктопное приложение, внутри ИИ-агент, который подключается к БД, получает данные о структуре таблиц/вьюшек. Справа сайдбар: интерфейс чата с агентом, а основное пространство - холст, на котором агент размещает что хочет сам. А именно - виджеты, которые делают запросы к БД, и выводят их в приятном глазу виде. Никакого удалённого бекенда, open-source, доступы к БД хранятся исключительно локально, всё секьюрно. Так как весь код открытый, то процесс я буду логировать в репозитории: github.com/ElKornacio/qyp-mini

habr.com/ru/articles/931390/

AI-agent for SQL databases with generative UI. Contribute to ElKornacio/qyp-mini development by creating an account on GitHub.
GitHubGitHub - ElKornacio/qyp-mini: AI-agent for SQL databases with generative UIAI-agent for SQL databases with generative UI. Contribute to ElKornacio/qyp-mini development by creating an account on GitHub.

[Перевод] AI-агенты в деле: 15 рабочих примеров для роста вашего бизнеса

AI-агенты радикально меняют подход технических команд к автоматизации, переходя от традиционных, основанных на правилах workflow к более динамичным, интеллектуальным системам, способным адаптироваться и принимать решения в реальном времени. В отличие от статической автоматизации, основанной на предопределенных триггерах и действиях, AI-агенты используют большие языковые модели (LLM) для обработки сложных данных, понимания контекста и реагирования на непредсказуемые сценарии. В этой статье мы рассмотрим 15 практических примеров AI-агентов, продемонстрируем, как они автоматизируют сложные задачи и оптимизируют рабочие процессы. Также мы объясним, как платформы вроде n8n упрощают разработку, кастомизацию и масштабирование AI-агентов для применения в реальных бизнес-кейсах. Поехали!

habr.com/ru/articles/930158/

ХабрAI-агенты в деле: 15 рабочих примеров для роста вашего бизнесаAI-агенты радикально меняют подход технических команд к автоматизации, переходя от традиционных, основанных на правилах workflow к более динамичным, интеллектуальным системам, способным адаптироваться...
#ai_agent#ai#ии

Свой ChatGPT на документах: делаем RAG с нуля

Всем привет! Наверняка у вас были ситуации, когда нужно быстро найти что-то в длинном документе-договоре, инструкции или отчёте. Сегодня я покажу, как сделать своего помощника, который будет отвечать на такие вопросы автоматически. Соберем RAG с нуля: загрузим документы, "нарежем" их на куски, проиндексируем в векторной базе данных Qdrant и подключим LLaMA. Если вы увидели незнакомые слова — не пугайтесь, далее я расскажу об этом подробно.

habr.com/ru/companies/amvera/a

ХабрСвой ChatGPT на документах: делаем RAG с нуляВсем привет! Наверняка у вас были ситуации, когда нужно быстро найти что-то в длинном документе-договоре, инструкции или отчёте. Сегодня я покажу, как сделать своего помощника, который будет отвечать...

AutoPrompting: как улучшить промпты, сэкономив время и ресурсы промпт-инженеров

В этой статье мы говорим об автопромптинге - что это такое, зачем он нужен и как он помогает уже сегодня промпт-инженерам.

habr.com/ru/articles/927026/

ХабрAutoPrompting: как улучшить промпты, сэкономив время и ресурсы промпт-инженеровВсем привет! Интересно, что на Хабре статьи по этой теме я не смог найти. Однако на западном и восточном сегментах довольно достаточно обсуждений. Надо бы исправить!...

[Перевод] MCP: новая игра на рынке искусственного интеллекта

Всё, что нужно знать о Model Context Protocol (MCP) «Даже самые продвинутые модели ограничены своей изоляцией от данных — они заперты в информационных силосах и легаси-системах». — Anthropic о важности интеграции контекста Сегодняшние большие языковые модели (LLM) невероятно умны, но находятся в вакууме. Как только им требуется информация вне их «замороженных» обучающих данных, начинаются проблемы. Чтобы AI-агенты действительно были полезны, им нужно получать актуальный контекст в нужный момент — будь то файлы, базы знаний, инструменты — и даже уметь совершать действия: обновлять документы, отправлять письма, запускать пайплайны. Так сложилось, что подключение модели ко всем этим внешним источникам данных было хаотичным и нестабильным: разработчикам приходилось писать кастомные интеграции или использовать узкоспециализированные плагины под каждый API или хранилище. Такие «сделанные на коленке» решения были хрупкими и плохо масштабировались. Чтобы упростить это, Anthropic представила Model Context Protocol (MCP) — открытый стандарт, предназначенный для того, чтобы связать AI-ассистентов с данными и инструментами, подключая любые источники контекста. MCP был анонсирован в ноябре 2024 года. Тогда реакция была сдержанной. Но сегодня MCP — на волне: он уже обогнал LangChain по популярности и, по прогнозам, скоро обойдёт OpenAPI и CrewAI. Крупные игроки AI-индустрии и open source-сообщества начали активно поддерживать MCP, видя в нем потенциально революционный инструмент для построения агентных систем на базе LLM.

habr.com/ru/articles/923650/

ХабрMCP: новая игра на рынке искусственного интеллектаВсё, что нужно знать о Model Context Protocol (MCP) «Даже самые продвинутые модели ограничены своей изоляцией от данных — они заперты в информационных силосах и легаси-системах». — Anthropic о...

Веб-агенты, которые действительно понимают веб-сайты: как слой восприятия Notte решает проблему DOM

Фундаментальная проблема веб-агентов заключается не в автоматизации — а в восприятии. Как позволить LLM навигировать и действовать на веб-сайтах, погребённых в слоях HTML?

habr.com/ru/articles/926432/

ХабрВеб-агенты, которые действительно понимают веб-сайты: как слой восприятия Notte решает проблему DOMФундаментальная проблема веб-агентов заключается не в автоматизации — а в восприятии. Как позволить LLM навигировать и действовать на веб-сайтах, погребённых в слоях HTML? Техническая проблема:...

Как внедрить AI CHAT в существующий бизнес: пошаговый план для роста среднего чека и лояльности

Сегодня об искусственном интеллекте не говорит только ленивый. Но для владельца реального бизнеса — будь то сеть ресторанов, ритейл или сфера услуг — все эти разговоры часто звучат слишком абстрактно. Как конкретно взять AI и встроить его в уже работающие процессы, чтобы он начал приносить измеримую пользу: повышать средний чек, укреплять лояльность клиентов и делать их опыт по-настоящему персональным?

habr.com/ru/articles/922780/

ХабрКак внедрить AI CHAT в существующий бизнес: пошаговый план для роста среднего чека и лояльностиСегодня об искусственном интеллекте не говорит только ленивый. Но для владельца реального бизнеса — будь то сеть ресторанов, ритейл или сфера услуг — все эти разговоры часто звучат слишком...

ИИ-агенты против чат-ботов: в чём разница и что выбрать бизнесу в 2025 году

В 2025 году, когда автоматизация стала нормой, компании всё чаще задаются вопросом: что эффективнее — чат-бот или ИИ-агент? Оба инструмента вроде бы отвечают клиентам, автоматизируют процессы и экономят ресурсы. Но разница между ними — как между калькулятором и персональным помощником. Давайте разберёмся. Что такое чат-бот? Чат-бот — это скрипт, настроенный отвечать на заранее определённые запросы. Он работает по сценарию: если пользователь спрашивает A — бот отвечает B. Хорошо работает в простых, повторяющихся ситуациях: бронирование, FAQ, статусы заказов. Плюсы чат-ботов:

habr.com/ru/articles/917918/

ХабрИИ-агенты против чат-ботов: в чём разница и что выбрать бизнесу в 2025 годуЧат-бот или ИИ-агент? В 2025 году, когда автоматизация стала нормой, компании всё чаще задаются вопросом: что эффективнее — чат-бот или ИИ-агент? Оба инструмента вроде бы отвечают клиентам,...

ИИ-агенты для автоматизации бизнеса: задачи, примеры и внедрение

Бизнес сегодня работает в условиях информационного перенасыщения, когда скорость обработки данных и принятия решений становится ключевым фактором успеха. Ежедневно компании сталкиваются с задачами: как сократить время на обработку запросов клиентов, как оперативно анализировать большие массивы информации, как снизить нагрузку на сотрудников и повысить качество сервиса? Ответ на эти вопросы всё чаще звучит в двух буквах – ИИ . Искусственный интеллект, в частности ИИ-агенты , предлагает новый уровень автоматизации бизнес-процессов.

habr.com/ru/articles/917714/

ХабрИИ-агенты для автоматизации бизнеса: задачи, примеры и внедрениеБизнес сегодня работает в условиях информационного перенасыщения, когда скорость обработки данных и принятия решений становится ключевым фактором успеха. Ежедневно компании сталкиваются с задачами:...

[Перевод] AI-агент говорит, что всё сделал. А ты уверен? Что нужно знать про оценку

Оценка AI-агентов — это процесс анализа и понимания того, насколько эффективно AI-агент выполняет задачи, принимает решения и взаимодействует с пользователями. В силу их автономной природы, качественная оценка агентов необходима для обеспечения их корректного функционирования. AI-агенты должны действовать в соответствии с замыслом разработчиков, быть эффективными и соответствовать определенным этическим принципам AI, чтобы удовлетворять потребности организации. Процесс оценки помогает удостовериться, что агенты соответствуют указанным требованиям.

habr.com/ru/articles/913222/

ХабрAI-агент говорит, что всё сделал. А ты уверен? Что нужно знать про оценкуОценка AI-агентов — это процесс анализа и понимания того, насколько эффективно AI-агент выполняет задачи, принимает решения и взаимодействует с пользователями. В силу их автономной природы,...

Как сделать RAG/ИИ-ассистента без кода

Если Вам нужно сконфигурировать персонального или командного AI ассистента без единой строчки кода, то инфраструктура OpenAI позволяет это сделать. Для примера сделаем бота который может писать сообщения в стиле определенного телеграм канала. Берем канал t.me/+yU0dsHboVmlhNGYy . Экспортируем сообщения из канала json.

habr.com/ru/articles/907960/

TelegramKodduu PythonНаучись программировать на Python на интересных примерах Самый быстрый курс https://stepik.org/a/187914 Самый нескучный курс https://stepik.org/a/185238 Во вопросам сотрудничества: @AlexErf

[Перевод] LLM-судья: как LLM отсекает правду от лжи?

LLM-as-a-judge — распространённая техника оценки продуктов на основе LLM. Популярность этой техники обусловлена практичностью: она представляет собой удобную альтернативу дорогостоящей человеческой оценке при анализе открытых текстовых ответов. Оценивать сгенерированные тексты сложно, будь то «простой» саммари или диалог с чат-ботом. Метрики типа accuracy плохо работают, поскольку «правильный» ответ может быть сформулирован множеством способов, не обязательно совпадающих с образцом. Кроме того, стиль или тон — субъективные характеристики, которые сложно формализовать. Люди способны учитывать такие нюансы, но ручная проверка каждого ответа плохо масштабируется. В качестве альтернативы появилась техника LLM-as-a-judge : для оценки сгенерированных текстов используются сами LLM. Интересно, что LLM одновременно являются и источником проблемы, и её решением!

habr.com/ru/articles/905728/

ХабрLLM-судья: как LLM отсекает правду от лжи?LLM-as-a-judge — распространённая техника оценки продуктов на основе LLM. Популярность этой техники обусловлена практичностью: она представляет собой удобную альтернативу дорогостоящей человеческой...