mastodon.world is one of the many independent Mastodon servers you can use to participate in the fediverse.
Generic Mastodon server for anyone to use.

Server stats:

8.4K
active users

#automl

0 posts0 participants0 posts today

Как мы в Авито предсказываем категории объявлений по описанию

Привет! Меня зовут Руслан Гилязев, я работаю в подразделении DS SWAT в Авито , руковожу командой платформы Item2param. В этой статье рассказываю, с помощью каких технологий мы решаем задачу классификации объявлений и почему это важно для бизнеса. Материал будет полезен DS-инженерам любого грейда и backend-инженерам, которые интересуются темой data science.

habr.com/ru/companies/avito/ar

ХабрКак мы в Авито предсказываем категории объявлений по описаниюПривет! Меня зовут Руслан Гилязев, я работаю в подразделении DS SWAT в Авито , руковожу командой платформы Item2param. Одна из моих задач — развивать модели, которые предсказывают параметры...
#NLP#ML#mlops

Архитектура проекта автоматического обучения ML-моделей

Хабр, привет! На связи Кравцов Кирилл и Суздалев Руслан из команды моделирования поведенческих сценариев Центра развития искусственного интеллекта СПАО «Ингосстрах» (далее – ЦРИИ). В статье поделимся решением, которое помогает нам быстрее обучать и интегрировать модели в компании. С ростом компании и ЦРИИ, в частности, у нас появлялось все больше бизнес-заказчиков, которым нужны были ML-модели. Поэтому потребность росла, а ограниченность ресурсов не позволяла быстро обрабатывать задачи бизнеса и многое уходило в беклог.

habr.com/ru/companies/ingos_it

ХабрАрхитектура проекта автоматического обучения ML-моделейХабр, привет! На связи Кравцов Кирилл и Суздалев Руслан из команды моделирования поведенческих сценариев Центра развития искусственного интеллекта СПАО «Ингосстрах» (далее – ЦРИИ). В статье поделимся...

AutoML и NAS

Автоматическое машинное обучение (AutoML) – это область исследований, целью которой является автоматизация ручных процессов настройки ML-пайплайнов, то есть полных циклов обработки данных при помощи ML-алгоритмов. Можно выделить основные этапы работы с данными в рамках стандартных подходов ML: сбор данных, их первичный анализ, предобработка (нормализация, кодирование признаков, оценка их важности и фильтрация, заполнение пропусков, поиск шумных признаков и выбросов в данных), выбор оптимальных моделей для решения задачи, возможные варианты комбинирования и ансамблирования моделей, оценка и внедрение итогового решения. Каждый элемент этой последовательности представляет из себя отдельную сложную задачу, требующую вложения труда специалистов. При этом та часть этих задач, которая представляет из себя подбор взаимозаменяемых элементов и оценку их производительности, может быть автоматизирована. Речь не идет об автоматизации сбора данных в широком смысле слова – слишком уж сложна и неоднородна эта задача – но автоматизация выбора наиболее оптимального набора моделей классического машинного обучения среди стандартного набора с учетом заранее поставленных ограничений кажется вполне решаемой проблемой. Методы оптимального поиска таких пайплайнов и решения ряда сложностей, возникающих в связи с такой широкой постановкой, называются автоматическим машинным обучением.

habr.com/ru/articles/889714/

ХабрAutoML и NASАвтор статьи: Сергей Артамонов - DS Wildberries, Research Engineer Skoltech, аспирант мехмата МГУ, преподаватель  Школы Высшей Математики Автоматическое машинное обучение (AutoML) – это область...

🤖 AutoML: AI Without Code?

Automated Machine Learning (AutoML) is changing the game. No coding, no complex algorithms—just AI-powered insights.
🚀 Industries using AutoML right now:
✅ Retail & E-commerce
✅ Finance
✅ Healthcare
✅ Marketing

But AutoML isn't magic—it still requires smart data strategies.

Check out this quick video: link.illustris.org/automl

💡 Is AutoML the future of AI?

🔗 #AI #MachineLearning #AutoML #TechTrends #AIForEveryone #ArtificialIntelligence

link.illustris.org- YouTubeEnjoy the videos and music you love, upload original content, and share it all with friends, family, and the world on YouTube.

The healthyverse meta package:

healthyR: Streamline hospital data workflows
healthyR.ts: Master time series analysis
healthyR.ai: Implement AI modeling seamlessly
healthyR.data: Access curated healthcare datasets
TidyDensity: Simplify probability distributions
tidyAML: Automate machine learning with tidymodels
RandomWalker: Explore random walk analysis

install.packages("healthyverse")
library(healthyverse)

spsanderson.com/healthyverse/

www.spsanderson.comEasily Install and Load the healthyverseThe healthyverse is a set of packages that work in harmony because they share common data representations and API design. This package is designed to make it easy to install and load multiple healthyverse packages in a single step.
#R#RStats#ML

The healthyverse meta package:

healthyR: Streamline hospital data workflows
healthyR.ts: Master time series analysis
healthyR.ai: Implement AI modeling seamlessly
healthyR.data: Access curated healthcare datasets
TidyDensity: Simplify probability distributions
tidyAML: Automate machine learning with tidymodels
RandomWalker: Explore random walk analysis

install.packages("healthyverse")
library(healthyverse)

spsanderson.com/healthyverse/

www.spsanderson.comEasily Install and Load the healthyverseThe healthyverse is a set of packages that work in harmony because they share common data representations and API design. This package is designed to make it easy to install and load multiple healthyverse packages in a single step.
#R#RStats#ML

🚀 #MindsDB: Platform for building #AI from enterprise data

🔗 Integrates with #databases, #vectorstores, and #applications

🤖 Deploy, serve, and fine-tune #AImodels in real-time

🔧 Connects to popular #AIML frameworks, including #AutoML and #LLMs

💻 Enhances #SQL syntax for seamless AI-powered app development

🛠️ Offers #SQL, #REST, #Python, #JavaScript, and #MongoDBQL interfaces

mindsdb.com/

mindsdb.comThe #1 Enterprise Data Platform for AIWe make enterprise data intelligent and responsive for AI. Build AI capabilities that can reason over enterprise data.

our paper on benchmarking AutoML frameworks for disease prediction using medical claims from 2022 biodatamining.biomedcentral.co #automl #machinelearning

BioMed CentralBenchmarking AutoML frameworks for disease prediction using medical claims - BioData MiningObjectives Ascertain and compare the performances of Automated Machine Learning (AutoML) tools on large, highly imbalanced healthcare datasets. Materials and Methods We generated a large dataset using historical de-identified administrative claims including demographic information and flags for disease codes in four different time windows prior to 2019. We then trained three AutoML tools on this dataset to predict six different disease outcomes in 2019 and evaluated model performances on several metrics. Results The AutoML tools showed improvement from the baseline random forest model but did not differ significantly from each other. All models recorded low area under the precision-recall curve and failed to predict true positives while keeping the true negative rate high. Model performance was not directly related to prevalence. We provide a specific use-case to illustrate how to select a threshold that gives the best balance between true and false positive rates, as this is an important consideration in medical applications. Discussion Healthcare datasets present several challenges for AutoML tools, including large sample size, high imbalance, and limitations in the available features. Improvements in scalability, combinations of imbalance-learning resampling and ensemble approaches, and curated feature selection are possible next steps to achieve better performance. Conclusion Among the three explored, no AutoML tool consistently outperforms the rest in terms of predictive performance. The performances of the models in this study suggest that there may be room for improvement in handling medical claims data. Finally, selection of the optimal prediction threshold should be guided by the specific practical application.

Практический кейс реализации AutoML в банке

Всем читателям Хабра привет! На связи дата сайентисты стрима разработки моделей для корпоративного сегмента банка ВТБ — Андрей Бояренков, Иван Кондраков, Станислав Арешин и Андрей Трушин. В этой статье мы хотим поговорить про конкретный кейс разработки процесса AutoML для моделей оценки вероятности дефолта клиентов (PD) в рамках экспресс-продуктов малого бизнеса. Расскажем, как выстроен наш процесс, как мы к этому пришли, с какими проблемами столкнулись, как их решили и как в дальнейшем планируем тиражировать на другие продукты банка. Читать

habr.com/ru/companies/vtb/arti

ХабрПрактический кейс реализации AutoML в банкеВсем читателям Хабра привет! На связи дата сайентисты стрима разработки моделей для корпоративного сегмента банка ВТБ — Андрей Бояренков , Иван Кондраков , Станислав Арешин и Андрей Трушин . В этой...

🚀 Simplify ML with {tidyAML}! This R package uses tidymodels for easy AutoML, offering a user-friendly interface to build high-quality models fast. No Java needed! Install it via CRAN or GitHub. Use `fast_regression_parsnip_spec_tbl` for quick non-tuning regression models. Try it out with a few lines of code and experience seamless, efficient model building. Perfect for all skill levels! 🌟

#RStats #MachineLearning #DataScience #tidyAML #AutoML

Post: spsanderson.com/steveondata/po