Что случилось?

Мы выложили Player+ к очередному занятию — спустя четыре года после предыдущих уроков. Его сопровождает по-новому отреставрированная аудиозапись.

Мы прошлись по ней от начала и до конца, отмечая все щелчки, кашель, смех и прочие «возмущающие» звуки, и в ручном режиме вычистили каждый такой эпизод, аккуратно сохраняя форманты голоса и подавляя фоновый шум.

Смех, кашель, щелчки «Вырезание» кашля

Затем мы удалили все длинноты и после этого, стараясь не навредить, удалили, насколько это возможно, фоновый шум. Сама запись изначально очень зашумленная и технически крайне низкого качества — все это очень усложняло задачу, но мне кажется, результат себя оправдал. Я даже отчетливо расслышал те реплики в отреставрированной записи, которые никак не давались при прослушивании оригинала.

После этого я попытался распознать речь с помощью ИИ. Он даже справился местами, но поскольку сама запись весьма посредственного качества и в ней так много вставок на французском и, что хуже, на ломаном французском, что от результатов такого «распознавания» пришлось отказаться — проще и быстрее было писать с нуля, чем править распознанный текст.

Почему нам нужна помощь?

Вся эта работа заняла у меня около месяца при работе с одним выходным в неделю. Помимо описанных шагов, сюда входит еще вычитка текстов, их правка и верстка.

Само транскрибирование — это в среднем 10 минут записи в день, хотя случаются и прорывы с двойной нормой, но это надо тогда совсем уж упираться день напролет. В норме подготовка и привязка текста к полуторачасовому уроку занимает две недели работы, но у меня темпы сбавлялись из-за параллельной вычитки и вёрстки.

Надо заметить, сама по себе эта работа, на мой вкус, довольно занятная. Ты видишь, как постепенно продвигаешься и неуклонно приближаешься к результату. Встречаются и вызовы в виде трудноразбираемых фраз, и какой же это восторг, когда на 30-м прослушивании ты вдруг понимаешь, что там произносилось. :) В общем, занудством это не назовешь.

Я подготовил двухминутный ролик о том, как эта работа в основном выглядит — он находится под спойлером наверху самой странички Player+ седьмого урока.

Как готовится Player+

И вот, собственно, ответ на вопрос, почему нам нужна помощь. Дело в том, что сам по себе le-francais.ru работает практически только на свою окупаемость. Мы сейчас с Антоном работаем над еще одним весьма крупным проектом, который, я надеюсь, позволит нам поправить наши дела. Он тоже связан с французским языком. Я позволил себе отвлечься на этот небольшой проект с седьмым уроком, но полностью переключиться на такую работу просто не могу себе позволить, пока наши дела так скверны.

В разное время мне писали наши подписчики и предлагали помощь. В конце концов, первые четыре плеера-плюс подготовила Вита Гришанина, не я — я занимался только реставрацией, вычиткой и версткой. И именно о ту пору мы подготовили весь инструментарий, который позволяет нам перегонять результат разметки текста в документ MS Word, где уже удобно вычищать все огрехи и делать нехитрую верстку — и даже делать вставки HTML-кода для таблиц и картинок! Привязка фраз ко времени спрятана в стандартных вордовых комментарих — остроумное решение, сильно развязывающее руки.

Из документа Word мы напрямую перегоняем транскрипт на вкладку Player+

Транскрипт в документе Word

Вот почему я смею надеяться, что среди наших подписчиков найдутся те, кто будет готов нам помочь с такими плеерами+.

Что нам есть предложить?

Мы не в том положении, чтобы отплатить за такой труд звонкой монетой, но у нас есть ресурс, которым мы с удовольствием поделимся с нашими потенциальными помощниками — это чашечки и билетики, которые открывают доступ к материалам уроков. Доступные 300+ уроков — это ощутимая экономия. Наверное, это не так много за две недели работы, но это все, что есть в нашем активе. И, разумеется, место на нашей доске почета — оно тоже гарантированно. :)

Откуда взялась цифра пять?

Почему в заголовке звучит это число — что это за пять уроков? Дело в том, что первые записи — с третьей по 12-ю были сделаны с очень низким качеством, и иметь для них Player+ было очень бы желательно. Начиная с 13-го урока качество ощутимо улучшилось, поэтому и была выбрана цель — до 12-го урока.

В какой программе делается привязка текста ко времени в записи?

Я периодически пересматриваю, что есть на рынке в этой области. Вне всякой конкуренции остается бесплатная разработка голландского Max Planck Institute for Psycholinguistics под названием ELAN. Она написана на языке программирования Java, что делает ее многоплатформенной — есть версии и для Windows, и для Mac. Ее легко освоить, я готов подготовить подробную инструкцию по работе с этой программой, но весь процесс на самом деле укладывается в достаточно небольшой набор операций.

Мне можно отвечать и прямо здесь на форуме, а можно писать на почту мой адрес email, в Telegram или в личку.

Я очень надеюсь, что общими усилиями мы реализуем эти мечты.

P. S. Речь не идёт о том, чтобы делать, как в старом анекдоте, пятилетку за два дня. Можно вписаться в такой проект и растянуть его на полгода. Сроки — не самый главный критерий. Главный критерий — постепенное продвижение. Каждый день по минуте или в неделю по пять — это тоже достижение. Движение — всё, скорость — ничто. :)

Нам нужна ваша помощь. Пожалуйста, поддержите Le-francais.ru !