Это действительно неожиданный ход с нашей стороны, но у нас возникла необходимость протестировать одну довольно новую технологию шумоподавления — с использованием нейронной сети. Для этого мы ищем владельцев определенного рода «железа» в их компьютерах, которое помогло бы нам провести эксперимент c реальными задачами. Поэтому этот пост будет немного техническим и интересным далеко не всем.
Итак, предыстория.
Я продолжаю выискивать способы реставрации записей уроков, и вопрос шумоподавления стоит там особенно остро. Традиционные технологии, удаляя шумы, оставляют артефакты. Так, что ты всегда стоишь перед выбором — или удалять их очень умеренно, или давить их, но поступаться качеством звука. Идеального решения нет. Но тут вроде бы просвистела серебряная пуля.
Совсем недавно я наткнулся на такую новость: Google представила технологию, которая повышает разрешение изображений до 16 раз без потери качества. Демка потрясает: на твоих глазах из никакущего «пикселизированного» изображения с почти полным отсутствием информации вырисовываются детальные портреты.
Как обычно, нейро-сеть сперва обучается на огромном количестве материала, прежде чем у нее появляется способность что-то воспроизводить. И я подумал, что по тому же принципу могли бы работать и технологии шумоподавления. И оказался прав!
Год с небольшим назад компания nVidia, которая выпускает видеокарты, выпустила приложение RTX Voice, которое умеет удалять фоновый шум с такой потрясающей воображение эффективностью и с полным отсутствием артефактов, что это просто шокирует (можно посмотреть пример такого шумоподавления).
Это приложение в своей работе использует вычислительные ядра видеокарты. И обнаружилось, что оно может работать даже со старыми 3D-акселераторами 10-летней давности — лишь бы в его названии имелись слова «Geforce GTX». Они сами заявляют об этом на своем сайте: «RTX Voice is now enabled for any NVIDIA GeForce, Quadro or TITAN GPU»
Поверив этому заявлению, я тут же помчался на другой конец города и по объявлению купил такую карточку 15-летней давности по бросовой цене в 500 рублей. Провозившись с ней полночи, я понял, что вопреки заявлениям, далеко не все карточки с таким названием позволяют использовать эту новую технологию шумоподавления.
Вот такое вот чудо теперь валяется у меня на полке.
Совместимыми оказались только те карточки, которые выпущены после 2012 года — 10-е поколение и выше (серия GeForce 650 GTX и далее). А такие карточки, даже совсем древние и совсем с базовой комплектацией, стоят уже от пяти тысяч рублей и выше.
И — вы не поверите! — до двухсот тысяч. 😮
Существует альтернативный способ опробовать эту технологию — программа Krisp. Она в своей работе использует ту же технологию искусственного интеллекта, но задействует мощности центрального процессора — ей не нужно никакое дополнительное оборудование. Я поигрался с ней. И оказалось, что для сильно зашумленных записей с низким битрейтом, как наши первые уроки, качество ее работы весьма невысоко — оно не лучше традиционного шумоподавления, и кроме того, в ней нет абсолютно никаких настроек — только вкл./выкл., нельзя даже выбрать степень шумоподавления.
Эксперименты с Krisp’ом несколько охладили мой пыл и подорвали веру в саму эту технологию (надо признать, что с теми задачами, на которые Krisp рассчитана — подавление посторонних шумов во время сеансов в Zoom’e/Skype, — она справляется неплохо). Но у меня остается надежда, что программа RTX Voice от nVidia может показать заметно лучший результат уже хотя бы потому, что для своей работы задействует ядра графического акселератора, а это гораздо более серьезные вычислительные мощности по сравнением с возможностями центрального процессора (надо понимать, что обе эти программы работают в реальном времени, то есть удаляют шумы на лету).
Пожертвовать пять тысяч на эксперимент с сомнительным результатом я не готов. Но попробовать, чтобы понять, не окажется ли эта технология более совершенным решением для моих задач по сравнению с ныне существующими, очень хочется. И поэтому, собственно, и сабж — нет ли среди вас (или ваших детей, может быть?) счастливого обладателя такой карточки? Напомню: это nVidia GeForce 650 GTX (10-е поколение) или более старшие модели. На сайте nVidia описаны требования по совместимости: To use RTX Voice, you must be using an NVIDIA GTX or RTX graphics card, update to Driver 410.18 or newer, and be on Windows 10.
Это геймерские карточки, изначально недешевые, поэтому если у кого такая в компьютере стоит, тот точно об этом знает. Признавайтесь, ребята, можете помочь с нашим экспериментом? Уж очень соблазнительно использовать l’intelligence artificielle в деле улучшения качества наших записей. :)