Часть 2: Rope-Ladder Tracker — от идеи к стабильной системе
Это продолжение статьи “Rope-Ladder Tracker: визуальный возврат без GPS” , где я представил концепцию структурированного позиционирования по принципу “верёвочной лестницы”. Тогда это была идея, прототип и первые кадры. Сегодня — полноценная, стабильная система, готовая к интеграции в реальный дрон.
https://habr.com/ru/articles/933046/
#c++ #python #computer_vision #opencv #научнопопулярное #научпоп
"Go Computer Vision Package GoCV Adds Support for OpenCV 4.12" - me on Hackster.io about the new @gocv release!
GoCV 0.42 is out with support for the latest @opencv 4.12, new CUDA functions, ViT DNN tracking, and lots more!
Full release notes here: https://github.com/hybridgroup/gocv/releases/tag/v0.42.0
Go get it right now!
OpenCV. Начало
В прошедшем июне исполнилось 25 лет первому релизу OpenCV. Господи, как летит время! Кажется, только вчера мы писали первые строчки . А уже четверть века с тех пор прошло. Самое время вспомнить, как все начиналось. Я не ставил себе целью рассказать в этой статье полную историю OpenCV — есть замечательная книга Гари и отличная статья в интеловом блоге и много других материалов. А у меня — скорее взгляд изнутри на то, как зарождался де-факто стандарт компьютерного зрения, размышления о причудливых развилках пути и факторе везения в технологии и дань уважения людям, с которыми мне довелось поработать.
Как приручить AI-пиксель-арт
За последние пару лет генеративные нейросети стали волшебной кисточкой для всего: концепт‑артов, иконок, иллюстраций, обложек, аватаров, спрайтов… Особенно — пиксель‑арта . В Midjourney, Stable Diffusion, Dall‑E, Image-1 и в других моделях можно просто вбить: «Pixel art goose with goggles in the style of SNES» — и получить шикарного пиксельного гуся за 10 секунд. Но если ты пробовал вставить такого гуся в игру — ты уже знаешь боль. Я решил вкопаться в эту тему поглубже и сделать open‑source‑инструмент, который автоматизирует превращение AI‑generated pixel art в pixel‑perfect pixel art.
Как приручить AI-пиксель-арт
За последние пару лет генеративные нейросети стали волшебной кисточкой для всего: концепт‑артов, иконок, иллюстраций, обложек, аватаров, спрайтов… Особенно — пиксель‑арта . В Midjourney, Stable Diffusion, Dall‑E, Image-1 и в других моделях можно просто вбить: «Pixel art goose with goggles in the style of SNES» — и получить шикарного пиксельного гуся за 10 секунд. Но если ты пробовал вставить такого гуся в игру — ты уже знаешь боль. Я решил вкопаться в эту тему поглубже и сделать open‑source‑инструмент, который автоматизирует превращение AI‑generated pixel art в pixel‑perfect pixel art.
Как мы оживили DPED: собираем датасет для обучения модели
Привет, Хабр! Сегодня с вами команда регионального научно-образовательного центра «Искусственный интеллект и анализ больших данных» при НГТУ им. Р. Е. Алексеева. Продолжаем рассказывать о нашей работе по возрождению и улучшению DPED (Deep Photo Enhancement Dataset). Это открытый проект исследователей из ETH Zurich, который включает как датасет парных изображений, так и нейросетевую модель для повышения качества мобильных фотографий до уровня DSLR. В нашем случае мы хотим довести снимки сэто планшета YADRO KVADRA_T, снимки с которого мы хотим довести по качеству до качествауровня полупрофессиональной камеры Sony Alpha ILCE 6600. Отметим, что цель проекта не только исследование и обучение модели, но и последующее внедрение полученных наработок в приложение камеры планшета. Мы рассматриваем варианты локального инференса на самом устройстве, включая оптимизацию модели под мобильные вычислительные платформы с использованием TensorRT или ONNX Runtime. Так улучшать изображения можно прямо на устройстве — либо в момент съемки, либо в фоновом режиме.
Prepping for my sci-fi inspired data science projects live stream
We decided on the last call to do img classification #CNN w/ #NVIDIA GPUs and #RAPIDS #opencv #cuml #seaborn #cuDF #cupy and started a PRD. I'll share my finished PRD and get to building live for 2 hours.
Wed, July 23 1:15p ET / 12:15p CT / 5:15p GMT
Feel free to come by & say 'hello'
https://www.youtube.com/live/2IPZ35XpZaY?si=IDqW2EHAGNDed7jZ
Промышленная автоматизация металлургического производства. Архитектурные решения и техническая реализация
Расскажем о практическом кейсе внедрения системы автоматизации на металлургическом предприятии. Покажем техническую реализацию архитектурных решений, разберем особенности интеграции промышленного оборудования и поделимся подходами к организации обмена данными в реальном времени. Особое внимание уделим реализации видеоаналитики производственных процессов и созданию замкнутого контура управления на базе микросервисной архитектуры.
探索 Python 中的音訊、視訊和網路攝影機 (從《自動化沉悶的事情》中遺失的章節)
➤ 使用 Python 輕鬆掌控多媒體處理
✤ https://inventwithpython.com/blog/lost-av-chapter.html
本文介紹瞭如何使用 Python 程式碼來錄製和播放多媒體內容,內容來自《自動化沉悶的事情》第三版的未發布章節。作者 Al Sweigart 說明瞭如何利用 OpenCV、sounddevice 和 wavio 等函式庫控制電腦的麥克風、網路攝影機和喇叭。文章涵蓋了音訊和視訊格式、常見的視訊大小和長寬比,以及從網路攝影機和麥克風錄製資料的方法。
+ 這太棒了!我一直在尋找一個簡單的方法來自動化一些影片編輯任務,這個章節正好提供了我需要的工具。
+ 對於想要學習如何用 Python 操作多媒體的初學者來說,這是一個很好的入門指南。
#Python #程式設計 #媒體處理 #OpenCV #音訊 #視訊
OpenCV Version 4.12.0 is now available! Highlights include: GIF decode and encode for imgcodecs, improved PNG and Animated PNG files handing, animated WebP Support, and especially the new HAL for RISC-V RVV 1.0 platforms.
Read more: https://opencv.org/blog/opencv-4-12-0-is-now-available/
Как мы улучшили режим ночной съемки в планшетах KVADRA_T
Привет, Хабр! На связи Полина Лукичева, инженер команды AI ML Kit в компании YADRO. В первой статье я рассказала о проблемах режима ночной съемки и методах их решения. Сегодня перехожу к практике — проведу предметное сравнение алгоритмов, выберу наиболее подходящие и покажу, как они работают в реальных условиях на планшетах
We have a new proposal for adding improvements for hardware acceleration, but that would require a breaking interface change.
What do you think? Feedback wanted!
Нейросеть приближается к опыту профессионального дерматолога
Наконец наступило лето, а с ним и пора отпусков. Уезжая на южные моря, не забывайте: большинство из нас имеет типичную для северянина кожу с пониженным содержанием меланина — пигмента, отвечающего за защиту от ультрафиолета. Если кожа отреагировала непонятным новообразованием, вызывающим опасения, теперь можно проконсультироваться с искусственным интеллектом. Он предварительно осмотрит кожу и посоветует, бежать ли ко врачу, за которым, конечно, всегда последнее слово. К слову, данная медицинская ИИ-технология, как и публикация, не является медицинской рекомендацией: диагноз ставит лечащий врач.