mastodon.world is one of the many independent Mastodon servers you can use to participate in the fediverse.
Generic Mastodon server for anyone to use.

Server stats:

8.4K
active users

#ai_agent

4 posts3 participants0 posts today

Свой ChatGPT на документах: делаем RAG с нуля

Всем привет! Наверняка у вас были ситуации, когда нужно быстро найти что-то в длинном документе-договоре, инструкции или отчёте. Сегодня я покажу, как сделать своего помощника, который будет отвечать на такие вопросы автоматически. Соберем RAG с нуля: загрузим документы, "нарежем" их на куски, проиндексируем в векторной базе данных Qdrant и подключим LLaMA. Если вы увидели незнакомые слова — не пугайтесь, далее я расскажу об этом подробно.

habr.com/ru/companies/amvera/a

ХабрСвой ChatGPT на документах: делаем RAG с нуляВсем привет! Наверняка у вас были ситуации, когда нужно быстро найти что-то в длинном документе-договоре, инструкции или отчёте. Сегодня я покажу, как сделать своего помощника, который будет отвечать...

AutoPrompting: как улучшить промпты, сэкономив время и ресурсы промпт-инженеров

В этой статье мы говорим об автопромптинге - что это такое, зачем он нужен и как он помогает уже сегодня промпт-инженерам.

habr.com/ru/articles/927026/

ХабрAutoPrompting: как улучшить промпты, сэкономив время и ресурсы промпт-инженеровВсем привет! Интересно, что на Хабре статьи по этой теме я не смог найти. Однако на западном и восточном сегментах довольно достаточно обсуждений. Надо бы исправить!...

[Перевод] MCP: новая игра на рынке искусственного интеллекта

Всё, что нужно знать о Model Context Protocol (MCP) «Даже самые продвинутые модели ограничены своей изоляцией от данных — они заперты в информационных силосах и легаси-системах». — Anthropic о важности интеграции контекста Сегодняшние большие языковые модели (LLM) невероятно умны, но находятся в вакууме. Как только им требуется информация вне их «замороженных» обучающих данных, начинаются проблемы. Чтобы AI-агенты действительно были полезны, им нужно получать актуальный контекст в нужный момент — будь то файлы, базы знаний, инструменты — и даже уметь совершать действия: обновлять документы, отправлять письма, запускать пайплайны. Так сложилось, что подключение модели ко всем этим внешним источникам данных было хаотичным и нестабильным: разработчикам приходилось писать кастомные интеграции или использовать узкоспециализированные плагины под каждый API или хранилище. Такие «сделанные на коленке» решения были хрупкими и плохо масштабировались. Чтобы упростить это, Anthropic представила Model Context Protocol (MCP) — открытый стандарт, предназначенный для того, чтобы связать AI-ассистентов с данными и инструментами, подключая любые источники контекста. MCP был анонсирован в ноябре 2024 года. Тогда реакция была сдержанной. Но сегодня MCP — на волне: он уже обогнал LangChain по популярности и, по прогнозам, скоро обойдёт OpenAPI и CrewAI. Крупные игроки AI-индустрии и open source-сообщества начали активно поддерживать MCP, видя в нем потенциально революционный инструмент для построения агентных систем на базе LLM.

habr.com/ru/articles/923650/

ХабрMCP: новая игра на рынке искусственного интеллектаВсё, что нужно знать о Model Context Protocol (MCP) «Даже самые продвинутые модели ограничены своей изоляцией от данных — они заперты в информационных силосах и легаси-системах». — Anthropic о...

Веб-агенты, которые действительно понимают веб-сайты: как слой восприятия Notte решает проблему DOM

Фундаментальная проблема веб-агентов заключается не в автоматизации — а в восприятии. Как позволить LLM навигировать и действовать на веб-сайтах, погребённых в слоях HTML?

habr.com/ru/articles/926432/

ХабрВеб-агенты, которые действительно понимают веб-сайты: как слой восприятия Notte решает проблему DOMФундаментальная проблема веб-агентов заключается не в автоматизации — а в восприятии. Как позволить LLM навигировать и действовать на веб-сайтах, погребённых в слоях HTML? Техническая проблема:...

Как внедрить AI CHAT в существующий бизнес: пошаговый план для роста среднего чека и лояльности

Сегодня об искусственном интеллекте не говорит только ленивый. Но для владельца реального бизнеса — будь то сеть ресторанов, ритейл или сфера услуг — все эти разговоры часто звучат слишком абстрактно. Как конкретно взять AI и встроить его в уже работающие процессы, чтобы он начал приносить измеримую пользу: повышать средний чек, укреплять лояльность клиентов и делать их опыт по-настоящему персональным?

habr.com/ru/articles/922780/

ХабрКак внедрить AI CHAT в существующий бизнес: пошаговый план для роста среднего чека и лояльностиСегодня об искусственном интеллекте не говорит только ленивый. Но для владельца реального бизнеса — будь то сеть ресторанов, ритейл или сфера услуг — все эти разговоры часто звучат слишком...

ИИ-агенты против чат-ботов: в чём разница и что выбрать бизнесу в 2025 году

В 2025 году, когда автоматизация стала нормой, компании всё чаще задаются вопросом: что эффективнее — чат-бот или ИИ-агент? Оба инструмента вроде бы отвечают клиентам, автоматизируют процессы и экономят ресурсы. Но разница между ними — как между калькулятором и персональным помощником. Давайте разберёмся. Что такое чат-бот? Чат-бот — это скрипт, настроенный отвечать на заранее определённые запросы. Он работает по сценарию: если пользователь спрашивает A — бот отвечает B. Хорошо работает в простых, повторяющихся ситуациях: бронирование, FAQ, статусы заказов. Плюсы чат-ботов:

habr.com/ru/articles/917918/

ХабрИИ-агенты против чат-ботов: в чём разница и что выбрать бизнесу в 2025 годуЧат-бот или ИИ-агент? В 2025 году, когда автоматизация стала нормой, компании всё чаще задаются вопросом: что эффективнее — чат-бот или ИИ-агент? Оба инструмента вроде бы отвечают клиентам,...

ИИ-агенты для автоматизации бизнеса: задачи, примеры и внедрение

Бизнес сегодня работает в условиях информационного перенасыщения, когда скорость обработки данных и принятия решений становится ключевым фактором успеха. Ежедневно компании сталкиваются с задачами: как сократить время на обработку запросов клиентов, как оперативно анализировать большие массивы информации, как снизить нагрузку на сотрудников и повысить качество сервиса? Ответ на эти вопросы всё чаще звучит в двух буквах – ИИ . Искусственный интеллект, в частности ИИ-агенты , предлагает новый уровень автоматизации бизнес-процессов.

habr.com/ru/articles/917714/

ХабрИИ-агенты для автоматизации бизнеса: задачи, примеры и внедрениеБизнес сегодня работает в условиях информационного перенасыщения, когда скорость обработки данных и принятия решений становится ключевым фактором успеха. Ежедневно компании сталкиваются с задачами:...

[Перевод] AI-агент говорит, что всё сделал. А ты уверен? Что нужно знать про оценку

Оценка AI-агентов — это процесс анализа и понимания того, насколько эффективно AI-агент выполняет задачи, принимает решения и взаимодействует с пользователями. В силу их автономной природы, качественная оценка агентов необходима для обеспечения их корректного функционирования. AI-агенты должны действовать в соответствии с замыслом разработчиков, быть эффективными и соответствовать определенным этическим принципам AI, чтобы удовлетворять потребности организации. Процесс оценки помогает удостовериться, что агенты соответствуют указанным требованиям.

habr.com/ru/articles/913222/

ХабрAI-агент говорит, что всё сделал. А ты уверен? Что нужно знать про оценкуОценка AI-агентов — это процесс анализа и понимания того, насколько эффективно AI-агент выполняет задачи, принимает решения и взаимодействует с пользователями. В силу их автономной природы,...

Как сделать RAG/ИИ-ассистента без кода

Если Вам нужно сконфигурировать персонального или командного AI ассистента без единой строчки кода, то инфраструктура OpenAI позволяет это сделать. Для примера сделаем бота который может писать сообщения в стиле определенного телеграм канала. Берем канал t.me/+yU0dsHboVmlhNGYy . Экспортируем сообщения из канала json.

habr.com/ru/articles/907960/

TelegramKodduu PythonНаучись программировать на Python на интересных примерах Самый быстрый курс https://stepik.org/a/187914 Самый нескучный курс https://stepik.org/a/185238 Во вопросам сотрудничества: @AlexErf

[Перевод] LLM-судья: как LLM отсекает правду от лжи?

LLM-as-a-judge — распространённая техника оценки продуктов на основе LLM. Популярность этой техники обусловлена практичностью: она представляет собой удобную альтернативу дорогостоящей человеческой оценке при анализе открытых текстовых ответов. Оценивать сгенерированные тексты сложно, будь то «простой» саммари или диалог с чат-ботом. Метрики типа accuracy плохо работают, поскольку «правильный» ответ может быть сформулирован множеством способов, не обязательно совпадающих с образцом. Кроме того, стиль или тон — субъективные характеристики, которые сложно формализовать. Люди способны учитывать такие нюансы, но ручная проверка каждого ответа плохо масштабируется. В качестве альтернативы появилась техника LLM-as-a-judge : для оценки сгенерированных текстов используются сами LLM. Интересно, что LLM одновременно являются и источником проблемы, и её решением!

habr.com/ru/articles/905728/

ХабрLLM-судья: как LLM отсекает правду от лжи?LLM-as-a-judge — распространённая техника оценки продуктов на основе LLM. Популярность этой техники обусловлена практичностью: она представляет собой удобную альтернативу дорогостоящей человеческой...

[Перевод] Инструменты, задачи, рассуждения: как понять, на что способен твой LLM-агент

LLM-агенты — отстой. Я провёл последнюю неделю, разрабатывая LLM-агента с возможностью веб-краулинга, используя популярный Python-фреймворк, чтобы собирать информацию о потенциальных лидах из интернета. Результат оказался полным разочарованием. Агент оказался медленным, нестабильным и с огромным числом багов (звучит знакомо? Передадим привет OpenAI!). Он постоянно делал ненужные вызовы функций, а иногда намертво застревал в бесконечных петлях "рассуждений", которые не имели никакого смысла. В итоге я на это забил и заменил его простым web-scraping скриптом, на написание кода которого у меня ушло 30 минут.

habr.com/ru/articles/904880/

ХабрИнструменты, задачи, рассуждения: как понять, на что способен твой LLM-агентLLM-агенты — отстой. Я провёл последнюю неделю, разрабатывая LLM-агента с возможностью веб-краулинга, используя популярный Python-фреймворк, чтобы собирать информацию о потенциальных лидах из...

[Перевод] Хочешь умного агента? Научись оценивать его правильно

В середине 2024 года AI-агенты стали главной темой обсуждений в технологическом сообществе — с помощью них теперь выполняют множество задач от заказа ингредиентов для ужина до бронирования билетов и записи на прием к врачу. Затем появились вертикальные AI-агенты — узкоспециализированные системы, о которых заговорили как о потенциальной замене привычных SaaS-решений. Но по мере роста влияния агентов увеличиваются и риски, связанные с их преждевременным внедрением. Недостаточно протестированный AI-агент может стать источником множества проблем: от неточных предсказаний и скрытых байасов до плохой адаптивности и уязвимостей в безопасности. Такие ошибки дезориентируют пользователей и подрывают доверие к системе, нарушая принципы fairness и транспарентности. Если вы разрабатываете AI-агента, наличие чёткой стратегии безопасного деплоймента критически важно. В этой статье мы рассмотрим, почему тщательная валидация необходима, разберём пошаговые подходы к тестированию и методы проведения комплексной оценки AI-агентов для обеспечения их надёжного развертывания.

habr.com/ru/articles/902608/

ХабрХочешь умного агента? Научись оценивать его правильноВ середине 2024 года AI-агенты стали главной темой обсуждений в технологическом сообществе — с помощью них теперь выполняют множество задач от заказа ингредиентов для ужина до бронирования билетов и...

[Перевод] Как тестировать AI-агентов, чтобы не было больно

AI-агенты трансформируют индустрии — от чат-ботов в службе поддержки до продвинутых ассистентов для программирования. Однако, чтобы они действительно были эффективными и заслуживающими доверия, необходимо их тщательное тестирование. Строгая процедура тестирования и оценки позволяет оценить производительность агента, адаптивность к новым сценариям и соответствие требованиям безопасности. В этой статье изложены структурированные шаги для тестирования и оценки AI-агентов с точки зрения надежности, устойчивости к сбоям и общего воздействия.

habr.com/ru/articles/902598/

ХабрКак тестировать AI-агентов, чтобы не было больноAI-агенты трансформируют индустрии — от чат-ботов в службе поддержки до продвинутых ассистентов для программирования. Однако, чтобы они действительно были эффективными и заслуживающими доверия,...

[Перевод] Оцени, прежде чем доверять: как сделать AI-агента полезным

Часто недооцененным аспектом разработки AI-агентов остаётся этап оценки. Хотя создать proof of concept относительно просто, поиск оптимальной конфигурации для балансировки стоимости, скорости, релевантности и других параметров требует значительных временных затрат. Инструменты и фреймворки для оценки являются ключевыми элементами этой стадии оптимизации.

habr.com/ru/articles/902594/

ХабрОцени, прежде чем доверять: как сделать AI-агента полезнымЧасто недооцененным аспектом разработки AI-агентов остаётся этап оценки. Хотя создать proof of concept относительно просто, поиск оптимальной конфигурации для балансировки стоимости, скорости,...

Безопасность AI-агентов в Web3. Часть 2: уязвимости современных LLM и соревновательный взлом

Продолжаем знакомиться с небезопасным Web3 и языковыми моделями, которые широко применяются для AI-агентов. В этой статье расскажу о новых подходах и примерах успешных jailbreak-запросов GPT4/4.5/Claude. Посмотрим на современные модели, в т.ч. те, которые и ломать не надо. Сравним стойкость разных моделей, а в конце разберем несколько конкурсных задач по взлому AI Web3 агентов. Первую часть можно найти тут

habr.com/ru/companies/pt/artic

ХабрБезопасность AI-агентов в Web3. Часть 2: уязвимости современных LLM и соревновательный взломСовременные методы джейлбрейков Как и обещал, после небольшой паузы мы продолжаем знакомиться с небезопасным Web3 и языковыми моделями, которые широко применяются для AI агентов. В этой части расскажу...

Безопасность AI-агентов в Web3. Часть 1: архитектура, уязвимости и старые добрые джейлбрейки

В последние годы мы наблюдаем активный рост популярности LLM-моделей и интереса к их интеграции в Web3-приложения, такие как DAO и dApp-боты или автоматические трейдеры. Представьте: смарт-контракт управляет финансами, а подключённая языковая модель принимает решения, основываясь на анализе новостей или команд пользователей. Ещё недавно такая идея казалась футуристичной, однако сегодня, в 2025 году, web3 AI-агенты, взаимодействующие с блокчейном и децентрализованными системами, стали реальностью. Многие уже слышали истории о том, как пользователи вынуждают LLM-модели отвечать на неэтичные вопросы, сочинять матерные стихи и совершать другие «шалости». Однако в контексте web3 подобные нестандартные поведения моделей могут привести к реальным и ощутимым финансовым последствиям. В этой статье мы рассмотрим устройство web3 AI-агентов, проанализируем возможные векторы атак, обсудим актуальные jailbreak-методы и разберём несколько конкурсных задач на примерах из личного опыта.

habr.com/ru/companies/pt/artic

ХабрБезопасность AI-агентов в Web3. Часть 1: архитектура, уязвимости и старые добрые джейлбрейкиСалют, Хабр! Я Рябинин Виктор, в Positive Technologies вместе с командой мы анализируем безопасность блокчейнов и смарт-контрактов, исследуем уязвимости и создаём инструменты для их обнаружения. В...