#optuna #mcp-server #automl #llm #technology
Origin | Interest | Match

Как мы в Авито предсказываем категории объявлений по описанию
Привет! Меня зовут Руслан Гилязев, я работаю в подразделении DS SWAT в Авито , руковожу командой платформы Item2param. В этой статье рассказываю, с помощью каких технологий мы решаем задачу классификации объявлений и почему это важно для бизнеса. Материал будет полезен DS-инженерам любого грейда и backend-инженерам, которые интересуются темой data science.
Архитектура проекта автоматического обучения ML-моделей
Хабр, привет! На связи Кравцов Кирилл и Суздалев Руслан из команды моделирования поведенческих сценариев Центра развития искусственного интеллекта СПАО «Ингосстрах» (далее – ЦРИИ). В статье поделимся решением, которое помогает нам быстрее обучать и интегрировать модели в компании. С ростом компании и ЦРИИ, в частности, у нас появлялось все больше бизнес-заказчиков, которым нужны были ML-модели. Поэтому потребность росла, а ограниченность ресурсов не позволяла быстро обрабатывать задачи бизнеса и многое уходило в беклог.
AutoML и NAS
Автоматическое машинное обучение (AutoML) – это область исследований, целью которой является автоматизация ручных процессов настройки ML-пайплайнов, то есть полных циклов обработки данных при помощи ML-алгоритмов. Можно выделить основные этапы работы с данными в рамках стандартных подходов ML: сбор данных, их первичный анализ, предобработка (нормализация, кодирование признаков, оценка их важности и фильтрация, заполнение пропусков, поиск шумных признаков и выбросов в данных), выбор оптимальных моделей для решения задачи, возможные варианты комбинирования и ансамблирования моделей, оценка и внедрение итогового решения. Каждый элемент этой последовательности представляет из себя отдельную сложную задачу, требующую вложения труда специалистов. При этом та часть этих задач, которая представляет из себя подбор взаимозаменяемых элементов и оценку их производительности, может быть автоматизирована. Речь не идет об автоматизации сбора данных в широком смысле слова – слишком уж сложна и неоднородна эта задача – но автоматизация выбора наиболее оптимального набора моделей классического машинного обучения среди стандартного набора с учетом заранее поставленных ограничений кажется вполне решаемой проблемой. Методы оптимального поиска таких пайплайнов и решения ряда сложностей, возникающих в связи с такой широкой постановкой, называются автоматическим машинным обучением.
AutoML: AI Without Code?
Automated Machine Learning (AutoML) is changing the game. No coding, no complex algorithms—just AI-powered insights. Industries using AutoML right now:
Retail & E-commerce
Finance
Healthcare
Marketing
But AutoML isn't magic—it still requires smart data strategies.
Check out this quick video: https://link.illustris.org/automl
Is AutoML the future of AI?
#AI #MachineLearning #AutoML #TechTrends #AIForEveryone #ArtificialIntelligence
Introducing **tidyAML**: the new R package for automated machine learning!
Quickly generate multiple regression models with just a few lines of code, all while leveraging the powerful **tidymodels** ecosystem.
No Java setup needed! Perfect for beginners & pros alike.
Check it out! #rstats #AutoML #DataScience #tidymodels #parsnip
Introducing **tidyAML**: the new R package for automated machine learning!
Quickly generate multiple regression models with just a few lines of code, all while leveraging the powerful **tidymodels** ecosystem.
No Java setup needed! Perfect for beginners & pros alike.
Check it out! #rstats #AutoML #DataScience #tidymodels #parsnip
The healthyverse meta package:
healthyR: Streamline hospital data workflows
healthyR.ts: Master time series analysis
healthyR.ai: Implement AI modeling seamlessly
healthyR.data: Access curated healthcare datasets
TidyDensity: Simplify probability distributions
tidyAML: Automate machine learning with tidymodels
RandomWalker: Explore random walk analysis
install.packages("healthyverse")
library(healthyverse)
The healthyverse meta package:
healthyR: Streamline hospital data workflows
healthyR.ts: Master time series analysis
healthyR.ai: Implement AI modeling seamlessly
healthyR.data: Access curated healthcare datasets
TidyDensity: Simplify probability distributions
tidyAML: Automate machine learning with tidymodels
RandomWalker: Explore random walk analysis
install.packages("healthyverse")
library(healthyverse)
• #MindsDB: Platform for building #AI from enterprise data
• Integrates with #databases, #vectorstores, and #applications
• Deploy, serve, and fine-tune #AImodels in real-time
• Connects to popular #AIML frameworks, including #AutoML and #LLMs
• Enhances #SQL syntax for seamless AI-powered app development
• Offers #SQL, #REST, #Python, #JavaScript, and #MongoDBQL interfaces
Giving a keynote on AutoML informed by LLM-powered knowledgebases for prescriptive analytics today at the @UF DAISY AI workshop. #automl #bioinformatics https://pop.pharmacy.ufl.edu/about/daisy-2024/
our paper on benchmarking AutoML frameworks for disease prediction using medical claims from 2022 https://biodatamining.biomedcentral.com/articles/10.1186/s13040-022-00300-2 #automl #machinelearning
Практический кейс реализации AutoML в банке
Всем читателям Хабра привет! На связи дата сайентисты стрима разработки моделей для корпоративного сегмента банка ВТБ — Андрей Бояренков, Иван Кондраков, Станислав Арешин и Андрей Трушин. В этой статье мы хотим поговорить про конкретный кейс разработки процесса AutoML для моделей оценки вероятности дефолта клиентов (PD) в рамках экспресс-продуктов малого бизнеса. Расскажем, как выстроен наш процесс, как мы к этому пришли, с какими проблемами столкнулись, как их решили и как в дальнейшем планируем тиражировать на другие продукты банка. Читать
Simplify ML with {tidyAML}! This R package uses tidymodels for easy AutoML, offering a user-friendly interface to build high-quality models fast. No Java needed! Install it via CRAN or GitHub. Use `fast_regression_parsnip_spec_tbl` for quick non-tuning regression models. Try it out with a few lines of code and experience seamless, efficient model building. Perfect for all skill levels!
#RStats #MachineLearning #DataScience #tidyAML #AutoML
Post: https://www.spsanderson.com/steveondata/posts/2024-07-15/
"AutoML for Object Detection: How to Train a Model to Identify Potholes"
Déborah Mesquita
'AMLB: an AutoML Benchmark', by Pieter Gijsbers et al.
http://jmlr.org/papers/v25/22-0493.html
#automl #benchmark #frameworks