Mercurial > mplayer.hg
annotate DOCS/xml/ru/encoding-guide.xml @ 21495:679ca24b6f48
r21508: emphasis the fact that leaving black borders really hurts quality
author | voroshil |
---|---|
date | Tue, 05 Dec 2006 19:49:19 +0000 |
parents | 70b9b7400bc3 |
children | 329b03d67891 |
rev | line source |
---|---|
20725 | 1 <?xml version="1.0" encoding="utf-8"?> |
21495
679ca24b6f48
r21508: emphasis the fact that leaving black borders really hurts quality
voroshil
parents:
21385
diff
changeset
|
2 <!-- synced with r21508 --> |
20725 | 3 <!-- **Partially** translated --> |
4 <chapter id="encoding-guide"> | |
5 <title>Кодирование с <application>MEncoder</application></title> | |
6 | |
7 <sect1 id="menc-feat-dvd-mpeg4"> | |
8 <title>Создание высококачественного MPEG-4 ("DivX") рипа из DVD фильма</title> | |
9 | |
10 <para> | |
11 Одним часто задаваемым вопросом является "Как мне сделать рип самого высокого | |
12 качества для заданного размера?". Другой вопрос "Как мне создать DVD рип с самым | |
13 высоким возможным качеством? Я не беспокоюсь о размере файла, мне нужно лишь | |
14 наилучшее качество.". | |
15 </para> | |
16 | |
17 <para> | |
18 Последний вопрос, похоже, отчасти неверно сформулирован. В конце концов, если | |
19 Вы не беспокоитесь о размере файла, почему бы просто не скопировать весь MPEG-2 | |
20 видео поток с DVD? Конечно, ваш AVI файл будет занимать около 5GB, | |
21 но если Вы желате наилучшее качество и не волнуетесь о размере, то это, | |
22 несомненно, лучшее решение. | |
23 </para> | |
24 | |
25 <para> | |
26 В действительности, причиной, по которой Вы хотите перекодировать DVD в MPEG-4, | |
27 является именно Ваше <emphasis role="bold">беспокойство</emphasis> | |
28 о размере файла. | |
29 </para> | |
30 | |
31 <para> | |
32 Сложно дать универсальный рецепт о создании DVD рипа очень высокого | |
33 качества. Необходимо рассмотреть несколько факторов, и Вы должны | |
34 понимать эти детали, иначе Вы, скорее всего, разочаруетесь своими | |
35 результатами. Ниже мы исследуем некоторые из этих вопросов, а затем | |
36 рассмотрим пример. Мы предполагаем, что Вы используете | |
37 <systemitem class="library">libavcodec</systemitem> для кодирования видео, | |
38 хотя теория также применима и к другим кодекам. | |
39 </para> | |
40 | |
41 <para> | |
42 Если это кажется для Вас слишком сложным, то Вам, пожалуй, следует использовать | |
43 один из многочисленных неплохих фронтендов, указанных в | |
44 <ulink url="http://www.mplayerhq.hu/design7/projects.html#mencoder_frontends">разделе MEncoder</ulink> | |
45 нашей страницы родственных проектов. | |
46 Так Вы должны получить высококачественные рипы без особых размышлений, | |
47 поскольку большинство этих утилит разработаны для принятия умных решений за Вас. | |
48 </para> | |
49 | |
50 <sect2 id="menc-feat-dvd-mpeg4-preparing-encode"> | |
51 <title>Подготовка к кодированию: Идентификация исходного материала и кадровой | |
52 частоты</title> | |
53 <para> | |
54 Прежде, чем даже задумываться о кодировании фильма, Вам необходимо выполнить | |
55 некоторые предварительные действия. | |
56 </para> | |
57 | |
58 <para> | |
59 Первым и наиболее важным шагом перед кодированием должно быть опеределение | |
60 типа содержимого, с которым Вы работате. | |
61 Если источником Ваших исходных материалов является DVD или | |
62 широковещательное/кабельное/спутниковое TV, оно будет содержаться в одном из | |
63 двух форматов: NTSC для Северной Америки и Японии, PAL для Европы и т.д.. | |
64 Однако, важно понимать, что это только форматирование для показа на | |
65 телевидении, и оно часто | |
66 <emphasis role="bold">не</emphasis> соответствует | |
67 исходному формату фильма. | |
68 Опыт показывает, что NTSC материал существенно более сложен для кодирования, | |
69 т.к. в нём содержится больше элементов, которые нужно идентифицировать. | |
70 Для проведения удачного кодирования, Вам необходимо знать исходный формат. | |
71 Отказ от принятия этого во внимание приведёт к различным дефектам в Вашем | |
72 кодировании, включая безобразные гребешки (артефакты череcстрочной развёртки) | |
73 и повторяющиеся или даже потерянные кадры. | |
74 Кроме ухудщения картинки, артефакты так же уменьшают эффективность кодирования: | |
75 Вы получите худшее качество на единицу битпотока. | |
76 </para> | |
77 | |
78 <sect3 id="menc-feat-dvd-mpeg4-preparing-encode-fps"> | |
79 <title>Определение кадровой чатоты источника</title> | |
80 <para> | |
81 Вот список, содержащий общие типы исходных материалов, где, | |
82 преимущественно, можно найти и их свойства: | |
83 </para> | |
84 <itemizedlist> | |
85 <listitem><para> | |
86 <emphasis role="bold">Стандартный фильм</emphasis>: Производятся | |
87 для театральных показов на 24 fps [кадр/сек]. | |
88 </para></listitem> | |
89 <listitem><para> | |
90 <emphasis role="bold">PAL видео</emphasis>: Записывается с помощью | |
91 PAL видеокамеры при 50 полях в секунду. | |
92 Поле состоит только из чётных или нечётных линий кадра. | |
93 Телевидение было разработано для обновления этих полей попеременно, | |
94 что используется как вид дешёвого аналогового сжатия. | |
95 Человеческий глаз, предположительно, компенсирует это, но однажды | |
96 поняв чересстрочную развёртку, Вы научитесь видеть её и на TV и | |
97 Вам больше никогда не понравится телевидение. | |
98 Два поля <emphasis role="bold">не</emphasis> составляют | |
99 целый кадр, поскольку они снимаются с задержкой в 1/50 секунды | |
100 и, следовательно, не формируют одно изображение, за исключением случая | |
101 полного отсутсвия движения. | |
102 </para></listitem> | |
103 <listitem><para> | |
104 <emphasis role="bold">NTSC видео</emphasis>: Записывается с помощью | |
105 NTSC видеокамеры при 60000/1001 полях в секунду, или 60 полях в секунду | |
106 в эпоху чёрно-белого TV. | |
107 В других отношениях аналогично PAL. | |
108 </para></listitem> | |
109 <listitem><para> | |
110 <emphasis role="bold">Анимация</emphasis>: Обычно рисуется на 24 fps, | |
111 но также существуют разновидности со смешанной кадровой частотой. | |
112 </para></listitem> | |
113 <listitem><para> | |
114 <emphasis role="bold">Компьютерныя графика (CG)</emphasis>: Может | |
115 быть с любой частотой кадров, но некоторые встречаются чаще остальных; | |
116 24 и 30 кадров в секунду типичны для NTSC, и 25 fps типично для PAL. | |
117 </para></listitem> | |
118 <listitem><para> | |
119 <emphasis role="bold">Старый фильм</emphasis>: Различные низкие | |
120 кадровые частоты. | |
121 </para></listitem> | |
122 </itemizedlist> | |
123 </sect3> | |
124 | |
125 <sect3 id="menc-feat-dvd-mpeg4-preparing-encode-material"> | |
126 <title>Идентификация исходного материала</title> | |
127 <para> | |
128 Фильмы, состоящие из кадров, называются фильмами с построчной (или прогрессивной) | |
129 развёрткой, а состоящие из независимых полей — фильмами с чересстрочной | |
130 развёрткой или просто видео; однако, последний термин двусмысленный. | |
131 </para> | |
132 <para> | |
133 Из-за дальнейших усложнений, некоторые фильмы будут смесью | |
134 нескольких, указанных выше. | |
135 </para> | |
136 <para> | |
137 Наиболее важным различием между всеми этими форматами является | |
138 то, что одни из них основаны на кадрах, а другие — на полях. | |
139 <emphasis role="bold">Любой</emphasis> фильм, подготовленный для | |
140 просмотра на телевидении (включая DVD), преобразуется в формат, | |
141 основанный на полях. | |
142 | |
143 <!-- FIXME: Существует ли лучший *краткий* (1-2 слова) перевод для | |
144 терминов pulldown и telecine? В литературе, которую я нашёл, | |
145 используют или указанные мной, по сути дела, транслитерации, | |
146 или так и оставляют английские названия. | |
147 А точный перевод можно выполнить только целым предложением | |
148 (т.е. определением), что совершенно неуместно в контексте | |
149 данного документа, где эти термины часто встречаются. --> | |
150 | |
151 Различные методы, с помощью которых это может быть сделано, совокупно | |
152 называются "телесин" (англ. telecine), одним из вариантов которого | |
153 является отвратительный NTSC "3:2 пулдаун" (англ. pulldown). | |
154 За исключением случаев, когда формат исходного материала был | |
155 также основан на полях (и с такой же частотой полей), Вы получите | |
156 фильм в формате отличном от исходного. | |
157 </para> | |
158 | |
159 <itemizedlist> | |
160 <title>Существует несколько общих типов пулдауна:</title> | |
161 <listitem><para> | |
162 <emphasis role="bold">PAL 2:2 пулдаун</emphasis>: Наилучший из всех. | |
163 Каждый кадр показывается за время длительности двух полей путем | |
164 извлечения чётных и нечётных строк и их попременного показа. | |
165 Если в исходном материале 24 fps, то это ускоряет воспроизведение фильма | |
166 на 4%. | |
167 </para></listitem> | |
168 <listitem><para> | |
169 <emphasis role="bold">PAL 2:2:2:2:2:2:2:2:2:2:2:3 пулдаун</emphasis>: | |
170 Каждый 12-й кадр показывается за время длительности трёх полей, | |
171 вместо двух. | |
172 Это помогает избежать проблемы 4%-го ускорения, но делает обращение | |
173 процесса существенно более сложным. | |
174 Такие вещи обычно наблюдаются в музыкальных произведениях, где | |
175 изменение скорости на 4% существенно повредит музыкальную партитуру. | |
176 </para></listitem> | |
177 <listitem><para> | |
178 <emphasis role="bold">NTSC 3:2 телесин</emphasis>: Кадры показываются | |
179 попеременно за время длительности 3-х полей или 2-х полей. | |
180 Это даёт частоту полей в 2.5 раза больше исходной частоты кадров. | |
181 Результат также очень незначительно замедляется от 60 до 60000/1001 | |
182 полей в секунду для поддержания частоты полей NTSC. | |
183 </para></listitem> | |
184 <listitem><para> | |
185 <emphasis role="bold">NTSC 2:2 пулдаун</emphasis>: Используется | |
186 для отображения материала с 30 fps на NTSC. | |
187 Так же мил, как и 2:2 PAL пулдаун. | |
188 </para></listitem> | |
189 </itemizedlist> | |
190 | |
191 <para> | |
192 Так же существуют методы для преобразования между NTSC и PAL видео, | |
193 но подобные темы выходят за рамки данного руководства. | |
194 Если Вам попался такой фильм, и Вы хотите кодировать его, | |
195 лучшим решением будет найти копию в исходном формате. | |
196 Преобразование между этими двумя форматами вносит большие потери | |
197 и не может быть точно обращено, так что Ваше кодирование | |
198 существенно пострадает, если оно делается из преобразованного | |
199 источника. | |
200 </para> | |
201 <para> | |
202 Когда видео находится на DVD, последовательные пары полей | |
203 группируются как кадр, даже если они не предназначены для | |
204 одновременного отображения. | |
205 Стандарт MPEG-2, используемый на DVD и цифровом TV предоставляет | |
206 возможность одновременно кодировать исходные кадры с построчной | |
207 развёрткой и сохранять число полей, в течении которых кадр | |
208 должен быть показан, в его заголовке. | |
209 Если был использован такой метод, фильм часто будет называться | |
210 как "мягкий телесин", т.к. процесс только указывает DVD-плееру | |
211 о необходимости применения пулдауна к фильму, не изменяя при этом | |
212 сам фильм. | |
213 Этот случай существенно предпочтителен, т.к. он может быть легко обращён | |
214 (в действительности, проигнорирован) кодером и т.к. он сохраняет | |
215 максимальное качество. | |
216 Однако, многие широковещательные и DVD студии не используют | |
217 надлежащую технологию кодирования и вместо этого производят | |
218 фильмы с "жёстким телесином", где поля в действительности | |
219 повторяются в кодированном MPEG-2. | |
220 </para> | |
221 <para> | |
222 Порядок действия в таких случаях будет описан | |
223 <link linkend="menc-feat-telecine">позже в данном руководстве</link>. | |
224 Сейчас мы дадим Вам несколько советов по идентификации типа | |
225 материала, с которым Вы работаете: | |
226 </para> | |
227 | |
228 <itemizedlist> | |
229 <title>Области NTSC:</title> | |
230 <listitem><para> | |
231 Если при просмотре Вашего фильма <application>MPlayer</application> | |
232 выводит, что частота кадров была изменена до 24000/1001 и она | |
233 никогда не меняется обратно, то это почти наверняка содержимое | |
234 с построчной развёрткой, которое было подвергнуто | |
235 "мягкому телесину". | |
236 </para></listitem> | |
237 <listitem><para> | |
238 Если <application>MPlayer</application> отображает попеременные | |
239 переключения частоты кадров между 24000/1001 и 30000/1001, и Вы | |
240 иногда видите "гребешки", есть несколько возможностей. | |
241 Сегменты с 24000/1001 fps почти наверняка являются "мягко | |
242 телесиненным" содержимым с построчной развёрткой, но части с | |
243 30000/1001 fps могут быть как "жёстко телесиненым" содержимым | |
244 с 24000/1001 fps, так и NTSC видео с 60000/1001 полями в секунду. | |
245 Испольуйте два нижеследующих руководства для определения того, | |
246 с каким случаем вы имеете дело. | |
247 </para></listitem> | |
248 <listitem><para> | |
249 Если <application>MPlayer</application> никогда не показывает | |
250 изменения кадровой частоты и каждый отдельный кадр, где есть | |
251 движение, оказывается гребёнкой, Ваш фильм есть NTSC видео с | |
252 60000/1001 полями в секунду. | |
253 </para></listitem> | |
254 <listitem><para> | |
255 Если <application>MPlayer</application> никогда не показывает | |
256 изменения кадровой частоты и два кадра из каждых пяти оказываются | |
257 гребёнкой, Ваш фильм представляет собой "жёстко телесиненное" | |
258 содержимое с 24000/1001 fps. | |
259 </para></listitem> | |
260 </itemizedlist> | |
261 | |
262 <itemizedlist> | |
263 <title>Области PAL:</title> | |
264 <listitem><para> | |
265 Если Вы не видите никакой гребёнки, Ваш фильм есть 2:2 пулдаун. | |
266 </para></listitem> | |
267 <listitem><para> | |
268 Если Вы видите попеременную гребёнку каждые полсекунды, | |
269 Ваш фильм представляет собой 2:2:2:2:2:2:2:2:2:2:2:3 пулдаун. | |
270 </para></listitem> | |
271 <listitem><para> | |
272 Если Вы всегда видите гребёшки во время движения, значит Ваш | |
273 фильм является PAL видео с 50 полями в секунду. | |
274 </para></listitem> | |
275 </itemizedlist> | |
276 | |
277 <note><title>Подсказка:</title> | |
278 <para> | |
279 <application>MPlayer</application> может замедлить воспроизведение | |
280 фильма с опцией -speed или воспроизводить его покадрово. | |
281 Попробуйте использовать опцию <option>-speed 0.2</option> для | |
282 очень медленного просмотра фильма или несколько раз нажмите | |
283 клавишу "<keycap>.</keycap>" для воспроизведения одного кадра | |
284 за раз и идетнифицируйте образец, если не можете его увидеть на | |
285 полной скорости. | |
286 </para> | |
287 </note> | |
288 </sect3> | |
289 </sect2> | |
290 | |
291 <sect2 id="menc-feat-dvd-mpeg4-2pass"> | |
292 <title>Постоянный квантователь против многопроходности</title> | |
293 | |
294 <para> | |
295 Возможно кодировать Ваш фильм, широко варьируя качество. | |
296 С современными видеокодерами и небольшим сжатием перед кодированием | |
297 (уменьшением размера и шумов) возможно достичь очень хорошего | |
298 качества при размере 700 МБ для 90-110-минутного широкоэкранного фильма. | |
299 Более того, всё, кроме самых длинных фильмов, может быть кодировано | |
300 с почти безупречным качеством на 1400 МБ. | |
301 </para> | |
302 | |
303 <para> | |
304 Есть три подхода при кодировании видео: постоянный битпоток (CBR), | |
305 постоянный квантователь и многопроходность (ABR или усреднённый битпоток). | |
306 </para> | |
307 | |
308 <para> | |
309 Сложность кадров фильма и, таким образом, число битов, нужных для их | |
310 сжатия может существенно отличаться от одной сцены к другой. | |
311 Современные видеокодеры могут подстраиваться под это в процессе | |
312 работы и варьировать битпоток. | |
313 Однако, в таких простых режимах как CBR кодеры не знают загруженность | |
314 битпотока в последующих сценах и т.о. не могут превысить затребованный | |
315 битпоток для больших промежутков времени. | |
316 Более продвинутые режимы, такие как многопроходный режим, могут | |
317 учитывать статистику предыдущих проходов; это решает проблему, | |
318 упомянутую выше. | |
319 </para> | |
320 | |
321 <note><title>Замечание:</title> | |
322 <para> | |
323 Большинство кодеков, поддерживающих ABR кодирование, поддерживают | |
324 только двупроходный режим, в то время как некоторые другие, такие | |
325 как <systemitem class="library">x264</systemitem>, | |
20879 | 326 <systemitem class="library">Xvid</systemitem> |
20725 | 327 и <systemitem class="library">libavcodec</systemitem> поддерживают |
328 многопроходность, несколько улучшающую качество на каждом проходе, | |
329 однако, это улучшение не измеримо и не заметно после 4-го прохода | |
330 или около того. | |
331 Поэтому, в данном разделе дву- и многопроходность будут | |
332 использоваться взаимозаменяемо. | |
333 </para> | |
334 </note> | |
335 | |
336 <para> | |
337 В каждом из этих режимов видеокодек (такой как | |
338 <systemitem class="library">libavcodec</systemitem>) | |
339 разбивает видеокадр на макроблоки размером 16х16 пикселей и потом | |
340 применяет квантователь к каждому макроблоку. Чем меньше квантоваль, | |
341 тем лучше качество и выше битпоток. | |
342 Метод, используемый видео кодером для определения того, какой | |
343 квантователь использовать для данного макроблока, варьируется и | |
344 подлежит тонкой настройке. (Это крайнее упрощение реального | |
345 процесса, но основная концепция полезна для понимания.) | |
346 </para> | |
347 | |
348 <para> | |
349 Когда Вы указываете постоянный битпоток, видеокодек будет кодировать | |
350 видео, отбрасывая детали столько, сколько необходимо и настолько мало, | |
351 насколько это возможно с целью оставаться ниже заданного битпотока. | |
352 Если Вас действительно не волнует размер файла, Вы можете также | |
353 использовать CBR и указать бесконечный битпоток. (На практике это | |
354 означает значение, достаточно большое для обозначения отсутствия | |
355 предела, например, 10000 Кбит.) В результате, без реального ограничения | |
356 битпотока, кодек использует наименьший возможный квантователь для | |
357 каждого макроблока (как указано опцией | |
358 <option>vqmin</option> для | |
359 <systemitem class="library">libavcodec</systemitem>, равной 2 по умолчанию). | |
360 Как только Вы укажите настолько низкий битпоток, что кодек будет | |
361 вынужден использовать более высокий квантователь, Вы почти наверняка | |
362 испортите качество Вашего видео. | |
363 Чтобы избежать этого, Вам, вероятно, придётся уменьшить размеры | |
364 Вашего видео, согласно методу, описанному далее в этом руководстве. | |
365 В общих чертах, Вам следует избегать CBR совсем, если Вы заботитесь | |
366 о качестве. | |
367 </para> | |
368 | |
369 <para> | |
370 С постоянным квантователем кодек использует для всех макроблоков | |
371 один и тот же квантователь, указанный в опции | |
372 <option>vqscale</option> (для | |
373 <systemitem class="library">libavcodec</systemitem>). | |
374 Если Вы хотите рип наивысшего возможного качества, снова не взирая | |
375 на битпоток, Вы можете использовать | |
376 <option>vqscale=2</option>. | |
377 Это приведёт к тому же битпотоку и PSNR (пику отношения сигнала к шуму), | |
378 что и CBR с | |
379 <option>vbitrate</option>=бесконечности и значением по умолчанию | |
380 <option>vqmin</option>, равным 2. | |
381 </para> | |
382 | |
383 <para> | |
384 Проблема с постоянным квантованием заключается в том, что кодек использует | |
385 заданный квантователь вне зависимости от того, требуется это для | |
386 макроблока или нет. То есть возможно использование большего квантователя | |
387 для макроблока без ухудшения видимого качества. Зачем тратить биты на | |
388 излишне низкий квантователь? У Вашего процессора есть столько тактов, | |
389 сколько есть времени, но имеется лишь ограниченное число битов на | |
390 жёстком диске. | |
391 </para> | |
392 | |
393 <para> | |
394 При двупроходном кодировании первый проход создаст рип фильма так, | |
395 как будто это был CBR, но сохранит лог свойств для каждого кадра. | |
396 Эта информация затем будет использована во время второго прохода | |
397 для принятия интеллектуальных решений о том, какой квантователь | |
398 следует использовать. Во время быстрого движения или сцен с | |
399 высокой детализацией с большой веротностью будут использованы | |
400 бОльшие квантователи, а во время медленного движения или сцен | |
401 с низкой детализацией — меньшие. | |
402 Обычно количество движения играет существенно более важную роль, | |
403 чем количество деталей. | |
404 </para> | |
405 | |
406 <para> | |
407 Если Вы используете <option>vqscale=2</option>, то Вы теряете биты. | |
408 Если Вы используете <option>vqscale=3</option>, то Вы не получаете | |
409 рип наивысшего качества. Предположим, вы делаете рип DVD, используя | |
410 <option>vqscale=3</option>, результат получается 1800 Кбит. | |
411 Если Вы сделаете двупроходное кодирование с | |
412 <option>vbitrate=1800</option>, получившееся видео быдет обладать | |
413 <emphasis role="bold">лучшим качеством</emphasis> для | |
414 <emphasis role="bold">того же битпотока</emphasis>. | |
415 </para> | |
416 | |
417 <para> | |
418 После того, как Вы сейчас убедились, что два прохода — это путь | |
419 к действию, возникает вопрос о том, какой битпоток использовать? | |
420 Ответ таков, что нет единого ответа. В идеале, Вы хотите выбрать | |
421 битпоток, при котором достигается наилучший баланс между качеством | |
422 и размером файла. Здесь возможны вариации в зависимости от | |
423 исходного видеоматериала. | |
424 </para> | |
425 | |
426 <para> | |
427 Если размер не важен, хорошей отправной точкой для рипа очень высокого | |
428 качества будет 2000 Кбит +/- 200 Кбит. | |
429 Для видеоматериала с быстрым движением или высокой детализацией | |
430 или просто если у Вас очень разборчивый глаз, Вы можете использовать | |
431 2400 или 2600. | |
432 Для некоторых DVD Вы не заметите разницы на 1400 Кбит. Хорошей идеей | |
433 является экспериментирование со сценами на разных битпотоках, чтобы | |
434 почувствовать разницу. | |
435 </para> | |
436 | |
437 <para> | |
438 Если Вашей целью является определённый размер, Вам нужно как-нибудь | |
439 вычислить битпоток. Но перед этим, Вам нужно знать, сколько места | |
440 нужно зарезервировать по аудио дорожку(и), так что Вам необходимо | |
441 <link linkend="menc-feat-dvd-mpeg4-audio">извлечь их</link> сперва. | |
442 Вы можете расчитать битпоток с помощью следующей формулы: | |
443 <systemitem>битпоток = (конечный_размер_в_МБайт - размер_звука_в_МБайт) * | |
444 1024 * 1024 / длительность_в_секундах * 8 / 1000</systemitem>. | |
445 Например, для сжатия двухчасового фильма в 702 МБ CD, с 60 МБ | |
446 аудио дорожкой, битпоток видео должен составлять: | |
447 <systemitem>(702 - 60) * 1024 * 1024 / (120*60) * 8 / 1000 | |
448 = 740 кбит/сек</systemitem>. | |
449 </para> | |
450 | |
451 </sect2> | |
452 | |
453 | |
454 <sect2 id="menc-feat-dvd-mpeg4-constraints"> | |
455 <title>Ограничения для эффективного кодирования</title> | |
456 | |
457 <para> | |
458 Из-за особенностей MPEG-подобного сжатия, существуют различные | |
459 ограничения, которым Вы должны следовать для достижения | |
460 максимального качества. | |
461 MPEG разбивает видео на квадраты 16х16, называемые макроблоками. | |
462 Каждый макроблок состоит из 4 блоков 8х8 с информацией о люме | |
463 (интенсивности) и двух блоков 8х8 с информацией о хроме (цвете) | |
464 половинного разрешения (один для красно-бирюзовой оси и другой | |
465 для жёлто-голубой оси). | |
466 Даже если ширина и высота Вашего фильма не кратны 16, кодер | |
467 всё равно использует нужное количество макроблоков 16х16 для покрытия | |
468 всей области картинки, дополнительная область будет впустую потрачена. | |
469 Так что в интересах максимизации качества при фиксированном размере | |
470 файла, не стоит использовать размеры, не кратные 16. | |
471 </para> | |
472 | |
473 <para> | |
474 У большинства DVD также есть определённое подобие чёрных полос на | |
21495
679ca24b6f48
r21508: emphasis the fact that leaving black borders really hurts quality
voroshil
parents:
21385
diff
changeset
|
475 краях. Если Вы их оставите, это может <emphasis>сильно</emphasis> |
679ca24b6f48
r21508: emphasis the fact that leaving black borders really hurts quality
voroshil
parents:
21385
diff
changeset
|
476 повредить качество несколькими путями. |
20725 | 477 </para> |
478 | |
479 <orderedlist> | |
480 <listitem> | |
481 <para> | |
482 MPEG-подобное сжатие также очень чувствительно к преобразованиям | |
483 частотных интервалов, в частности, к дискретному косинусному | |
484 преобразованию (DCT), которое аналогично преобразованию Фурье. | |
485 Этот вид сжатия эффективен для представления образов и сглаженных | |
486 переходов, но у него возникают проблемы с острыми краями. | |
487 <!-- FIXME: для слова ringing я тоже не нашёл краткого однозначного | |
488 перевода; лучшее, что приходит на ум - это "размывание краёв", | |
489 ясное дело, что причиной является отбрасывание малых гармоник, | |
490 в результате чего вместо точки возникает затухающая окружность, | |
491 но вот как это кратко выразить... --> | |
492 Для кодирования последних Вам нужно гораздо больше битов, а иначе | |
493 у вас появится артефакт, известный как размывание краёв | |
494 (англ. ringing). | |
495 </para> | |
496 | |
497 <para> | |
498 Частотные преобразования (DCT) выполняются независимо для каждого | |
499 макроблока (на самом деле, для каждого блока), так что эта проблема | |
500 возникает только в случае попадания острого края внутрь блока. | |
501 Если Ваши чёрные поля возникают точно на границах, кратных 16 | |
502 пикселям, это не проблема. | |
503 Однако, чёрные полосы на DVD редко хорошо расположены, так что | |
504 на практике Вам всегда придётся усекать стороны для избежания | |
505 этих проблем. | |
506 </para> | |
507 </listitem> | |
508 </orderedlist> | |
509 | |
510 <para> | |
511 В дополнение к преобразованиям частотных интервалов, MPEG-подобное | |
512 сжатие использует векторы движения для отображения изменений от | |
513 одного кадра к другому. Векторы движения, естественно, работают | |
514 существенно менее эффективно для новых объектов, идущих от | |
515 краёв картинки, поскольку они отсутсвуют в предыдущих кадрах. | |
516 Пока картинка простирается вплоть до края кодируемой области, | |
517 у векторов движения не возникает проблем с движением объектов | |
518 за пределы картинки. Однако, при наличии черных полей | |
519 могут возникнуть проблемы: | |
520 </para> | |
521 | |
522 <orderedlist continuation="continues"> | |
523 <listitem> | |
524 <para> | |
525 Для каждого макроблока MPEG-подобное сжатие сохраняет вектор, | |
526 определяющий какая часть предыдущего кадра должна быть скопирована | |
527 в этот макроблок как основа для предсказания следующего кадра. | |
528 Кодированию подлежит только оставшаяся разность. Если макроблок | |
529 простирается до края картинки и содержит часть чёрной полосы, | |
530 то векторы движения других частей каритки перепишут чёрную полосу. | |
531 Это означает, что много битов нужно потратить либо на повторное | |
532 чернение переписанной полосы, либо (что более вероятно) вектор | |
533 движения не будет использован вовсе и все изменения для этого | |
534 макроблока будут явно кодированы. Другими словами, эффективность | |
535 кодирования существенно уменьшается. | |
536 </para> | |
537 | |
538 <para> | |
539 Ещё раз, эта проблема возникает только в случае, если чёрные полосы | |
540 не укладываются в границы, кратные 16. | |
541 </para> | |
542 </listitem> | |
543 | |
544 <listitem> | |
545 <para> | |
546 Наконец, предположим, что у нас есть находящийся внутри картинки | |
547 макроблок и объект движется в этот блок от края изображения. | |
548 MPEG-подобное кодирование не может сказать "скопируй ту часть, | |
549 что внутри картинки, но не чёрную полосу". Так что чёрная полоса | |
550 также быдет скопирована внутрь, в результате чего масса битов | |
551 будет потрачена на кодирование части изображения, которое должно | |
552 быть на месте полосы. | |
553 </para> | |
554 | |
555 <para> | |
556 Для случаев, когда всё изображение движется к краю кодируемой | |
557 области, у MPEG есть специальные оптимизации для многократного | |
558 копирования пикселей на край картинки, когда вектор движения | |
559 идёт извне области кодирования. Эта возможность становится | |
560 бесполезной, если у фильма есть чёрные полосы. В отличии от | |
561 случаев 1 и 2, выравнивание границ до кратности 16 здесь | |
562 не поможет. | |
563 </para> | |
564 </listitem> | |
565 | |
566 <listitem> | |
567 <para> | |
568 Несмотря на то, что границы полностью чёрные и никогда не изменяются, | |
569 существуют, как минимум, определённые накладные расходы, связанные | |
570 с наличием большего числа макроблоков. | |
571 </para> | |
572 </listitem> | |
573 </orderedlist> | |
574 | |
575 <para> | |
576 Благодаря всем этим причинам, рекомендуется полностью урезать | |
577 чёрные полосы. Более того, если есть области шумов/искажений | |
578 на краях картинки, то их урезание также поспособствует улучшению | |
579 качества кодирования. Видеофилы, желающие сохранить оригинал как | |
580 можно более точно, могут возражать против такого усечения; но | |
581 если Вы не планируете кодировать при постоянном квантователе, | |
582 качество, полученное при усечении, существенно превысит потери | |
583 информации на краях. | |
584 </para> | |
585 </sect2> | |
586 | |
587 | |
588 <sect2 id="menc-feat-dvd-mpeg4-crop"> | |
589 <title>Усечение и масштабирование</title> | |
590 | |
591 <para> | |
592 Вспомните из предыдущего раздела, что конечный размер картинки, | |
593 подлежащей кодированию, должен быть кратен 16 (как высота,так | |
594 и ширина). Это может быть достигнуто усечением, масштабированием | |
595 или комбинацией того и другого. | |
596 </para> | |
597 | |
598 <para> | |
599 Есть несколько рекомендаций для усечения, которым необходимо следовать | |
600 для избежания повреждения фильма. | |
601 Обычный формат YUV, 4:2:0, сохраняет хрому (информацию о цвете) | |
602 половинной дискретизации, т.е. хрома сохраняется в два раза реже | |
603 в каждом направлении, чем люма (информация об интенсивности). | |
604 Рассмотрите следующую диаграмму, где L обозначает точки дискретизации | |
605 люмы и C — хромы. | |
606 </para> | |
607 | |
608 <informaltable> | |
609 <?dbhtml table-width="40%" ?> | |
610 <?dbfo table-width="40%" ?> | |
611 <tgroup cols="8" align="center"> | |
612 <colspec colnum="1" colname="col1"/> | |
613 <colspec colnum="2" colname="col2"/> | |
614 <colspec colnum="3" colname="col3"/> | |
615 <colspec colnum="4" colname="col4"/> | |
616 <colspec colnum="5" colname="col5"/> | |
617 <colspec colnum="6" colname="col6"/> | |
618 <colspec colnum="7" colname="col7"/> | |
619 <colspec colnum="8" colname="col8"/> | |
620 <spanspec spanname="spa1-2" namest="col1" nameend="col2"/> | |
621 <spanspec spanname="spa3-4" namest="col3" nameend="col4"/> | |
622 <spanspec spanname="spa5-6" namest="col5" nameend="col6"/> | |
623 <spanspec spanname="spa7-8" namest="col7" nameend="col8"/> | |
624 <tbody> | |
625 <row> | |
626 <entry>L</entry> | |
627 <entry>L</entry> | |
628 <entry>L</entry> | |
629 <entry>L</entry> | |
630 <entry>L</entry> | |
631 <entry>L</entry> | |
632 <entry>L</entry> | |
633 <entry>L</entry> | |
634 </row> | |
635 <row> | |
636 <entry spanname="spa1-2">C</entry> | |
637 <entry spanname="spa3-4">C</entry> | |
638 <entry spanname="spa5-6">C</entry> | |
639 <entry spanname="spa7-8">C</entry> | |
640 </row> | |
641 <row> | |
642 <entry>L</entry> | |
643 <entry>L</entry> | |
644 <entry>L</entry> | |
645 <entry>L</entry> | |
646 <entry>L</entry> | |
647 <entry>L</entry> | |
648 <entry>L</entry> | |
649 <entry>L</entry> | |
650 </row> | |
651 <row> | |
652 <entry>L</entry> | |
653 <entry>L</entry> | |
654 <entry>L</entry> | |
655 <entry>L</entry> | |
656 <entry>L</entry> | |
657 <entry>L</entry> | |
658 <entry>L</entry> | |
659 <entry>L</entry> | |
660 </row> | |
661 <row> | |
662 <entry spanname="spa1-2">C</entry> | |
663 <entry spanname="spa3-4">C</entry> | |
664 <entry spanname="spa5-6">C</entry> | |
665 <entry spanname="spa7-8">C</entry> | |
666 </row> | |
667 <row> | |
668 <entry>L</entry> | |
669 <entry>L</entry> | |
670 <entry>L</entry> | |
671 <entry>L</entry> | |
672 <entry>L</entry> | |
673 <entry>L</entry> | |
674 <entry>L</entry> | |
675 <entry>L</entry> | |
676 </row> | |
677 </tbody> | |
678 </tgroup> | |
679 </informaltable> | |
680 | |
681 <para> | |
682 Как Вы видите, строки и столбцы изображения естественным образом | |
683 идут в парах. Поэтому смещения и размеры усечения | |
684 <emphasis>должны</emphasis> быть чётными числами. | |
685 Иначе хрома перестанет правильно соответствовать люме. | |
686 Теоретически возможно усечение с нечётными смещениями, но оно | |
687 потребует преобразования хромы, что потенциально является | |
688 операцией с потерей качества и не поддерживается фильтром | |
689 усечения сторон crop. | |
690 </para> | |
691 | |
692 <para> | |
693 Далее, видео с чересстрочной развёрткой дискретизируется следующим | |
694 образом: | |
695 </para> | |
696 | |
697 <informaltable> | |
698 <?dbhtml table-width="80%" ?> | |
699 <?dbfo table-width="80%" ?> | |
700 <tgroup cols="16" align="center"> | |
701 <colspec colnum="1" colname="col1"/> | |
702 <colspec colnum="2" colname="col2"/> | |
703 <colspec colnum="3" colname="col3"/> | |
704 <colspec colnum="4" colname="col4"/> | |
705 <colspec colnum="5" colname="col5"/> | |
706 <colspec colnum="6" colname="col6"/> | |
707 <colspec colnum="7" colname="col7"/> | |
708 <colspec colnum="8" colname="col8"/> | |
709 <colspec colnum="9" colname="col9"/> | |
710 <colspec colnum="10" colname="col10"/> | |
711 <colspec colnum="11" colname="col11"/> | |
712 <colspec colnum="12" colname="col12"/> | |
713 <colspec colnum="13" colname="col13"/> | |
714 <colspec colnum="14" colname="col14"/> | |
715 <colspec colnum="15" colname="col15"/> | |
716 <colspec colnum="16" colname="col16"/> | |
717 <spanspec spanname="spa1-2" namest="col1" nameend="col2"/> | |
718 <spanspec spanname="spa3-4" namest="col3" nameend="col4"/> | |
719 <spanspec spanname="spa5-6" namest="col5" nameend="col6"/> | |
720 <spanspec spanname="spa7-8" namest="col7" nameend="col8"/> | |
721 <spanspec spanname="spa9-10" namest="col9" nameend="col10"/> | |
722 <spanspec spanname="spa11-12" namest="col11" nameend="col12"/> | |
723 <spanspec spanname="spa13-14" namest="col13" nameend="col14"/> | |
724 <spanspec spanname="spa15-16" namest="col15" nameend="col16"/> | |
725 <tbody> | |
726 <row> | |
727 <entry namest="col1" nameend="col8">Верхнее поле</entry> | |
728 <entry namest="col9" nameend="col16">Нижнее поле</entry> | |
729 </row> | |
730 <row> | |
731 <entry>L</entry> | |
732 <entry>L</entry> | |
733 <entry>L</entry> | |
734 <entry>L</entry> | |
735 <entry>L</entry> | |
736 <entry>L</entry> | |
737 <entry>L</entry> | |
738 <entry>L</entry> | |
739 <entry></entry> | |
740 <entry></entry> | |
741 <entry></entry> | |
742 <entry></entry> | |
743 <entry></entry> | |
744 <entry></entry> | |
745 <entry></entry> | |
746 <entry></entry> | |
747 </row> | |
748 <row> | |
749 <entry spanname="spa1-2">C</entry> | |
750 <entry spanname="spa3-4">C</entry> | |
751 <entry spanname="spa5-6">C</entry> | |
752 <entry spanname="spa7-8">C</entry> | |
753 <entry></entry> | |
754 <entry></entry> | |
755 <entry></entry> | |
756 <entry></entry> | |
757 <entry></entry> | |
758 <entry></entry> | |
759 <entry></entry> | |
760 <entry></entry> | |
761 </row> | |
762 <row> | |
763 <entry></entry> | |
764 <entry></entry> | |
765 <entry></entry> | |
766 <entry></entry> | |
767 <entry></entry> | |
768 <entry></entry> | |
769 <entry></entry> | |
770 <entry></entry> | |
771 <entry>L</entry> | |
772 <entry>L</entry> | |
773 <entry>L</entry> | |
774 <entry>L</entry> | |
775 <entry>L</entry> | |
776 <entry>L</entry> | |
777 <entry>L</entry> | |
778 <entry>L</entry> | |
779 </row> | |
780 <row> | |
781 <entry>L</entry> | |
782 <entry>L</entry> | |
783 <entry>L</entry> | |
784 <entry>L</entry> | |
785 <entry>L</entry> | |
786 <entry>L</entry> | |
787 <entry>L</entry> | |
788 <entry>L</entry> | |
789 <entry></entry> | |
790 <entry></entry> | |
791 <entry></entry> | |
792 <entry></entry> | |
793 <entry></entry> | |
794 <entry></entry> | |
795 <entry></entry> | |
796 <entry></entry> | |
797 </row> | |
798 <row> | |
799 <entry></entry> | |
800 <entry></entry> | |
801 <entry></entry> | |
802 <entry></entry> | |
803 <entry></entry> | |
804 <entry></entry> | |
805 <entry></entry> | |
806 <entry></entry> | |
807 <entry spanname="spa9-10">C</entry> | |
808 <entry spanname="spa11-12">C</entry> | |
809 <entry spanname="spa13-14">C</entry> | |
810 <entry spanname="spa15-16">C</entry> | |
811 </row> | |
812 <row> | |
813 <entry></entry> | |
814 <entry></entry> | |
815 <entry></entry> | |
816 <entry></entry> | |
817 <entry></entry> | |
818 <entry></entry> | |
819 <entry></entry> | |
820 <entry></entry> | |
821 <entry>L</entry> | |
822 <entry>L</entry> | |
823 <entry>L</entry> | |
824 <entry>L</entry> | |
825 <entry>L</entry> | |
826 <entry>L</entry> | |
827 <entry>L</entry> | |
828 <entry>L</entry> | |
829 </row> | |
830 <row> | |
831 <entry>L</entry> | |
832 <entry>L</entry> | |
833 <entry>L</entry> | |
834 <entry>L</entry> | |
835 <entry>L</entry> | |
836 <entry>L</entry> | |
837 <entry>L</entry> | |
838 <entry>L</entry> | |
839 <entry></entry> | |
840 <entry></entry> | |
841 <entry></entry> | |
842 <entry></entry> | |
843 <entry></entry> | |
844 <entry></entry> | |
845 <entry></entry> | |
846 <entry></entry> | |
847 </row> | |
848 <row> | |
849 <entry spanname="spa1-2">C</entry> | |
850 <entry spanname="spa3-4">C</entry> | |
851 <entry spanname="spa5-6">C</entry> | |
852 <entry spanname="spa7-8">C</entry> | |
853 <entry></entry> | |
854 <entry></entry> | |
855 <entry></entry> | |
856 <entry></entry> | |
857 <entry></entry> | |
858 <entry></entry> | |
859 <entry></entry> | |
860 <entry></entry> | |
861 </row> | |
862 <row> | |
863 <entry></entry> | |
864 <entry></entry> | |
865 <entry></entry> | |
866 <entry></entry> | |
867 <entry></entry> | |
868 <entry></entry> | |
869 <entry></entry> | |
870 <entry></entry> | |
871 <entry>L</entry> | |
872 <entry>L</entry> | |
873 <entry>L</entry> | |
874 <entry>L</entry> | |
875 <entry>L</entry> | |
876 <entry>L</entry> | |
877 <entry>L</entry> | |
878 <entry>L</entry> | |
879 </row> | |
880 <row> | |
881 <entry>L</entry> | |
882 <entry>L</entry> | |
883 <entry>L</entry> | |
884 <entry>L</entry> | |
885 <entry>L</entry> | |
886 <entry>L</entry> | |
887 <entry>L</entry> | |
888 <entry>L</entry> | |
889 <entry></entry> | |
890 <entry></entry> | |
891 <entry></entry> | |
892 <entry></entry> | |
893 <entry></entry> | |
894 <entry></entry> | |
895 <entry></entry> | |
896 <entry></entry> | |
897 </row> | |
898 <row> | |
899 <entry></entry> | |
900 <entry></entry> | |
901 <entry></entry> | |
902 <entry></entry> | |
903 <entry></entry> | |
904 <entry></entry> | |
905 <entry></entry> | |
906 <entry></entry> | |
907 <entry spanname="spa9-10">C</entry> | |
908 <entry spanname="spa11-12">C</entry> | |
909 <entry spanname="spa13-14">C</entry> | |
910 <entry spanname="spa15-16">C</entry> | |
911 </row> | |
912 <row> | |
913 <entry></entry> | |
914 <entry></entry> | |
915 <entry></entry> | |
916 <entry></entry> | |
917 <entry></entry> | |
918 <entry></entry> | |
919 <entry></entry> | |
920 <entry></entry> | |
921 <entry>L</entry> | |
922 <entry>L</entry> | |
923 <entry>L</entry> | |
924 <entry>L</entry> | |
925 <entry>L</entry> | |
926 <entry>L</entry> | |
927 <entry>L</entry> | |
928 <entry>L</entry> | |
929 </row> | |
930 </tbody> | |
931 </tgroup> | |
932 </informaltable> | |
933 | |
934 <para> | |
935 Как Вы видите, структура повторяется только после 4 строк. | |
936 Так что для чересстрочного видео Ваше y-смещение и высота | |
937 усечения должны быть кратны 4. | |
938 </para> | |
939 | |
940 <para> | |
941 Естественные разрешения DVD составляют 720x480 для NTSC и 720x576 | |
942 для PAL, но существует флаг соотношения сторон, который указывает | |
943 является ли видео полноэкранным (4:3) или широкоэкранным (16:9). | |
944 Многие (если не большинство) широкоэкранных DVD не точно соответсвуют | |
945 <!-- FIXME: Есть ли перевод названия формата cinescope (он же CinemaScope) ?? --> | |
946 формату 16:9 и он может быть как 1.85:1, так и 2.35:1 (формат cinescope). | |
947 Это означает, что в видео будут чёрные полосы, которые нужно усечь. | |
948 </para> | |
949 | |
950 <para> | |
951 <application>MPlayer</application> предоставляет фильтр обнаружения | |
952 усечения, который определяет прямоугольник, до которго нужно усечь | |
953 (<option>-vf cropdetect</option>). | |
954 Запустите <application>MPlayer</application> с | |
955 <option>-vf cropdetect</option> и он выдаст настройки | |
956 усечения для удаления полей. | |
957 С целью получения точных параметров усечения, Вы должны проигрывать | |
958 фильм достаточно долго для того, чтоб была использована вся область | |
959 изображения. | |
960 </para> | |
961 | |
962 <para> | |
963 Затем проверьте значения, полученные с помощью | |
964 <application>MPlayer</application>, используя командную строку, | |
965 выведенную <option>cropdetect</option>, и подстройте прямоугольник | |
966 при необходимости. | |
967 Фильтр <option>rectangle</option> может быть полезен, позволив | |
968 Вам интерактивно менять прямоугольник усечения для Вашего фильма. | |
969 Не забывайте следовать указанным выше руководствам по делимости, | |
970 чтобы не испортить выравнивание хромы. | |
971 </para> | |
972 | |
973 <para> | |
974 В ряде случаев масштабирование может быть нежелательным. | |
975 Масштабирование по вертикальному направлению затруднено для | |
976 чересстрочного видео, и если Вы хотите сохранить чересстрочность, | |
977 Вам в большинстве случаев будет необходимо воздерживаться от | |
978 масштабирования. | |
979 Если Вы не будете масштабировать, но всё ещё желаете размеры, | |
980 кратные 16, то Вам придётся проводить излишнее усечение. | |
981 Не проводите неполное усечение, поскольку чёрные полосы очень | |
982 плохи для кодирования! | |
983 </para> | |
984 | |
985 <para> | |
986 Посокльку MPEG-4 использует макроблоки 16х16, Вы должны убедиться, | |
987 что каждое измерение кодируемого видео кратно 16; иначе Вы ухудшите | |
988 качество, особенно на малых битпотоках. Вы можете сделать это, | |
989 округлив ширину и высоту прямоугольника усечения до ближайшего | |
990 меньшего целого, кратного 16. | |
991 Учитывая установленное ранее, при усечении Вы можете захотеть увеличить | |
992 смещение по Y на половину разности старой и новой высоты, так что | |
993 полученное видео будет браться из центра кадра. | |
994 | |
995 И из-за способа дискретизации DVD видео, убедитесь, что смещение | |
996 есть чётное число. (Фактически, возьмите за правило никогда не | |
997 использовать нечётные величины для любых параметров усечения или | |
998 масштабирования видео.) Если Вы беспокоитесь из-за нескольких | |
999 излишне отброшенных битов, возможно, Вы предпочтёте взамен | |
1000 масштабировать видео. | |
1001 В действительности, Вы можете доверить фильтру | |
1002 <option>cropdetect</option> сделать для Вас всё вышеупомянутое, | |
1003 т.к. у него есть необязательный параметр округления | |
1004 <option>round</option>, равный 16 по умолчанию. | |
1005 </para> | |
1006 | |
1007 <para> | |
1008 Также будьте осторожны с "полутёмными" пикселями на краях. Убедитесь, | |
1009 что они тоже отрезаются, иначе Вы будете тратить биты, которым есть | |
1010 лучшее применение. | |
1011 </para> | |
1012 | |
1013 <para> | |
1014 После всего выше сказанного и сделанного, Вы, вероятно, получите | |
1015 видео не точно формата 1:85.1 или 2.35:1, а с чем-то близким | |
1016 к этому. Вы можете вычислить новый коэффициент соотношения | |
1017 сторон вручную, но <application>MEncoder</application> | |
1018 предоставляет опцию для <systemitem class="library">libavcodec</systemitem>, | |
1019 называемую <option>autoaspect</option>, которая сделает это для | |
1020 Вас. Ни в коем случае не увеличивайте размер этого видео с целью | |
1021 квадратизации пикселей, если Вы не желаете впустую потратить | |
1022 место на жёстком диске. | |
1023 Масштабирование должно выполняться при воспроизведении, и плеер | |
1024 использует коэффициент соотношения сторон, сохранённый в AVI, для | |
1025 определения правильного разрешения. | |
1026 К сожалению, не все плееры используют эту информацию автомасштабирования, | |
1027 поэтому Вам всё ещё может быть необходимо перемасштабирование. | |
1028 </para> | |
1029 </sect2> | |
1030 | |
1031 | |
1032 <sect2 id="menc-feat-dvd-mpeg4-resolution-bitrate"> | |
1033 <title>Выбор разрешения и битпотока</title> | |
1034 | |
1035 <para> | |
1036 Если Вы не собираетеся кодировать в режиме постоянного квантователя, | |
1037 Вам нужно выбрать битпоток. | |
1038 Понятие битпотока очень просто: это среднее число битов, которые | |
1039 будут использованы для сохранения Вашего фильма, в секунду. | |
1040 Обычно битпоток измеряется в килобитах (1000 бит) в секунду. | |
1041 Размер Вашего фильма на диске есть битпоток, умноженный на | |
1042 длительность фильма, плюс небольшие накладные расходы | |
1043 (см. раздел | |
1044 <link linkend="menc-feat-dvd-mpeg4-muxing-avi-limitations">контейнер AVI</link> | |
1045 для примера). | |
1046 Остальные параметры, такие как масштабирование, усечение и т.п. | |
1047 <emphasis role="bold">не</emphasis> изменят размер файла, пока | |
1048 Вы также не измените битпоток! | |
1049 </para> | |
1050 <para> | |
1051 Битпоток изменяется <emphasis role="bold">не</emphasis> | |
1052 пропорционально разрешению. | |
1053 То есть файл разрешением 320х240 с 200 кбит/сек не будет | |
1054 того же качества, что этот же фильм разрешением 640х480 | |
1055 и 800 кбит/сек! | |
1056 Для этого есть две причины: | |
1057 <orderedlist> | |
1058 <listitem><para> | |
1059 <emphasis role="bold">Восприятие</emphasis>: Вы сильнее | |
1060 замечаете MPEG артефакты, если они больше! | |
1061 Артефакты возникают на масштабе блоков (8х8). | |
1062 Ваш глаз не увидит ошибки в 4800 маленьких блоков так же | |
1063 легко, как и в 1200 больших блоков (предполагая | |
1064 масштабирование обоих фильмов на полный экран). | |
1065 </para></listitem> | |
1066 <listitem><para> | |
1067 <emphasis role="bold">Теоретическая</emphasis>: Когда Вы | |
1068 уменьшаете размер изображения, но продолжаете использовать | |
1069 блоки того же размера (8х8) для пространственных частотных | |
1070 преобразований, Вы перемещаете больше данных в высокочастотные | |
1071 полосы. Грубо говоря, каждый пиксель содержит больше деталей, | |
1072 чем раньше. | |
1073 Так что несмотря на то, что ваша картинка с уменьшенным | |
1074 масштабом содержит 1/4 информации в пространственных направлениях, | |
1075 она всё ещё может содержать большУю часть информации в | |
1076 частотных интервалах (предполагая, что высокие частоты были | |
1077 не использованы в оригинальном 640х480 изображении). | |
1078 </para></listitem> | |
1079 </orderedlist> | |
1080 </para> | |
1081 <para> | |
1082 Последние руководства рекомендовали выбор битпотока и разрешения, | |
1083 основываясь на приближении "бит на пиксель", но это обычно не | |
1084 верно из-за упомянутых выше причин. | |
1085 Похоже, лучшей оценкой является рост битпотока пропорционально | |
1086 квадратному корню разрешения, так что 320х240 и 400 кбит/сек | |
1087 должно быть сравнимо с 640х480 и 800 кбит/сек. | |
1088 Однако, это не было строго проверено теоретически или эмпирически. | |
1089 Кроме того, из-за существенного отличия фильмов по уровню шума, | |
1090 деталей, степеней свободы и т.п., тщетно давать общие рекомендации | |
1091 для "битов на длину диагонали" (аналог битов на пиксель, используя | |
1092 квадратный корень). | |
1093 </para> | |
1094 <para> | |
1095 Таким образом, мы обсудили сложность выбора битпотока и разрешения. | |
1096 </para> | |
1097 | |
1098 | |
1099 <sect3 id="menc-feat-dvd-mpeg4-resolution-bitrate-compute"> | |
1100 <title>Расчёт разрешения</title> | |
1101 <para> | |
1102 Следующие шаги помогут Вам расчитать разрешение для Вашего | |
1103 кодирования без слишком сильного искажения видео, учитывая | |
1104 некоторую информацию об исходном видео. | |
1105 Прежде всего, Вам необходимо расчитать коэффициент соотношения | |
1106 сторон для кодированного видео: | |
1107 <systemitem>ARc = (Wc x (ARa / PRdvd )) / Hc</systemitem> | |
1108 <itemizedlist> | |
1109 <title>где:</title> | |
1110 <listitem><para> | |
1111 Wc и Hc — ширина и высота усечённого видео, | |
1112 </para></listitem> | |
1113 <listitem><para> | |
1114 ARa — коэффициент соотношения сторон изображения, обычно 4/3 или 16/9, | |
1115 </para></listitem> | |
1116 <listitem><para> | |
1117 PRdvd — отношение пикселей DVD, что равно 1.25=(720/576) для PAL | |
1118 DVD и 1.5=(720/480) для NTSC DVD. | |
1119 </para></listitem> | |
1120 </itemizedlist> | |
1121 </para> | |
1122 | |
1123 <para> | |
1124 Затем Вы можете расчитать разрешение по X и Y, согласно определённому | |
1125 фактору качества сжатия (CQ): | |
1126 <systemitem>ResY = INT(SQRT( 1000*Битпоток/25/ARc/CQ )/16) * 16</systemitem> | |
1127 и <systemitem>ResX = INT( ResY * ARc / 16) * 16</systemitem>. | |
1128 </para> | |
1129 | |
1130 <para> | |
1131 Хорошо, но что такое CQ? | |
1132 CQ соответсвует числу битов на пиксель и на кадр для кодирования. | |
1133 Грубо говоря, чем больше CQ, тем меньше вероятность увидеть | |
1134 артефакты кодирования. | |
1135 Однако, если у Вас есть заданный размер для Вашего фильма | |
1136 (например, 1 или 2 CD), есть ограниченное общее число битов, | |
1137 которые Вы можете потратить; поэтому важно найти хороший | |
1138 компромисс между сжимаемостью и качеством. | |
1139 </para> | |
1140 | |
1141 <para> | |
1142 CQ зависит от битпотока, эффективности видеокодека и разрешения фильма. | |
1143 Обычно, в целях увеличеиня CQ, Вам нужно будет уменьшить размер | |
1144 фильма при постоянном битпотоке, заданном размере и длине фильма. | |
20879 | 1145 С MPEG-4 ASP кодеками, такими как <systemitem class="library">Xvid</systemitem> |
20725 | 1146 и <systemitem class="library">libavcodec</systemitem>, CQ |
1147 меньше 0.18 обычно приводит к изображению с большим числом | |
1148 сегментов "квадратиками", из-за недостаточного числа битов для | |
1149 кодирования информации в каждом макроблоке. | |
1150 (MPEG4, как и многие другие кодеки, группирует пиксели в блоки по | |
1151 несколько пикселей для сжатия изображения; если битов не хватает, | |
1152 границы этих блоков становятся заметными.) | |
1153 Следовательно, благоразумно выбрать CQ в диапазоне от 0.20 до 0.22 | |
1154 для рипа на 1 CD и 0.26-0.28 для рипа на 2 CD при использовании | |
1155 стандартных опций кодирования. | |
1156 Более продвинутые опции кодирования, такие как указанные для | |
1157 <link linkend="menc-feat-mpeg4-lavc-example-settings"><systemitem class="library">libavcodec</systemitem></link> | |
1158 и | |
20879 | 1159 <link linkend="menc-feat-xvid-example-settings"><systemitem class="library">Xvid</systemitem></link> |
20725 | 1160 должны сделать возможным получение того же качества с CQ в диапазоне |
1161 от 0.18 до 0.20 для рипа на 1 CD и 0.24-0.26 для рипа на 2 CD. | |
1162 Используя MPEG-4 ASP кодеки, такие как | |
1163 <systemitem class="library">x264</systemitem>, Вы можете использовать | |
1164 CQ в диапазоне от 0.14 до 0.16 со стандартными опциями кодирования | |
1165 и должны суметь достичь таких низких значений, как 0.10-0.12 | |
1166 с помощью | |
1167 <link linkend="menc-feat-x264-example-settings">продвинутых опций кодирования <systemitem class="library">x264</systemitem></link>. | |
1168 </para> | |
1169 | |
1170 <para> | |
1171 Пожалуйста, обратите внимание, что CQ — лишь показательная величина, | |
1172 т.к. она зависит от кодируемого содержимого; CQ 0.18 может хорошо | |
1173 смотреться для Бергмана (Bergman), в отличии от такого фильма как | |
1174 Матрица (The Matrix), содержащего много сцен с быстрым движением. | |
1175 С другой стороны, бесполезно увеличивать CQ выше 0.30, т.к. Вы | |
1176 будете тратить биты без заметного увеличения качества. | |
1177 Так же обратите внимание, что, как было указано выше в данном | |
1178 руководстве, фильмам с низким разрешением (например, по сравнению с DVD) | |
1179 необходим более высокий CQ для того, чтоб они выглядели хорошо. | |
1180 </para> | |
1181 </sect3> | |
1182 | |
1183 </sect2> | |
1184 | |
1185 <sect2 id="menc-feat-dvd-mpeg4-filtering"> | |
1186 <title>Фильтрация</title> | |
1187 | |
1188 <para> | |
1189 Изучение использования видео фильтров <application>MEncoder</application> | |
1190 важно для получения хороших результатов кодирования. | |
1191 Вся обработка видео выполняется посредством фильтров: усечение, | |
1192 масштабирование, подстройка цвета, удаление шума, увеличение | |
1193 чёткости, деинтерлейс (преобразование видео из чересстрочной | |
1194 развёртки в построчную), телесин, обратный телесин и удаление | |
1195 блочной сегментации — и это лишь некоторые из них. | |
1196 Вместе с огромным количеством поддерживаемых входных форматов, | |
1197 разнообразие фильтров, доступных в <application>MEncoder</application>, | |
1198 является одним из его основных достоинств над другими аналогичными | |
1199 программами. | |
1200 </para> | |
1201 | |
1202 <para> | |
1203 Фильтры загружаются в цепочки с помощью опции -vf: | |
1204 | |
1205 <screen>-vf фильтр1=опции,фильтр2=опции,...</screen> | |
1206 | |
1207 Большинство фильтров используют численные значения опций, | |
1208 разделённые двоеточиями, но синтаксис этих параметров различается | |
1209 у разных фильтров, так что читайте мануал для детальной | |
1210 информации о фильтрах, которые Вы желаете использовать. | |
1211 </para> | |
1212 | |
1213 <para> | |
1214 Фильтры действуют на видео в порядке их загрузки. | |
1215 Например, следующая цепочка: | |
1216 | |
1217 <screen>-vf crop=688:464:12:4,scale=640:464</screen> | |
1218 | |
1219 сперва усечёт область изображения до 688х464 с верхним левым | |
1220 углом (12,4), а затем масштабирует результат до 640х464. | |
1221 </para> | |
1222 | |
1223 <para> | |
1224 Некоторые фильтры нужно загружать в начале цепочки фильтров (или | |
1225 рядом с ним) с целью получения преимущества от использования | |
1226 информации после видеодекодера, которая будет потеряна или | |
1227 искажена другими фильтрами. | |
1228 Важнейшими примерами являются: <option>pp</option> (постобработка, | |
1229 только при выполнении операций удаления блочной сегментации | |
1230 (deblocking) или увеличения чёткости краёв (deringing)), | |
1231 <option>spp</option> (другой фильтр постобработки, служащий для | |
1232 удаления артефактов MPEG), <option>pullup</option> (обратный | |
1233 телесин), и <option>softpulldown</option> (для преобразования | |
1234 мягкого телесина в жёсткий). | |
1235 </para> | |
1236 | |
1237 <para> | |
1238 В общем случае, Вам следует делать настолько мало фильтрации, | |
1239 насколько это возможно, для того чтоб остаться близко к оригинальному | |
1240 DVD источнику. Усечение часто необходимо (как описано выше), но | |
1241 избегайте масштабирования видео. Несмотря на то, что уменьшение | |
1242 размера иногда предпочтительно при использовании больших | |
1243 квантователей, нужно избегать и того, и другого: помните, | |
1244 что мы с самого начала решили обменять биты на качество. | |
1245 </para> | |
1246 | |
1247 <para> | |
1248 Также не корректируйте гамму, контрастность, яркость и т.п.. То, | |
1249 что хорошо выглядит на Вашем мониторе, может плохо выглядеть | |
1250 на других. Коррекция должна выполняться только при воспроизведении. | |
1251 </para> | |
1252 | |
1253 <para> | |
1254 Однако, есть одна вещь, которую Вы, быть может, захотите сделать — | |
1255 это пропустить видео через очень слабый фильтр удаления шумов, | |
1256 такой как <option>-vf hqdn3d=2:1:2</option>. | |
1257 Ещё раз, причиной этому является то, что этим битам можно найти | |
1258 лучшее применение: зачем тратить их, кодируя шум, если Вы просто | |
1259 можете вернуть этот шум в процессе воспроизведения? | |
1260 Увеличение параметров для <option>hqdn3d</option> дополнительно | |
1261 улучшит сжимаемость, но увеличив значения слишком сильно, Вы рискуете | |
1262 ухудшить различимость изображения. | |
1263 Рекомендованные выше значения (<option>2:1:2</option>) слегка | |
1264 консервативны; не бойтесь экспериментировать с более высокими | |
1265 значениями и самостоятельно оценивать результаты. | |
1266 </para> | |
1267 | |
1268 </sect2> | |
1269 | |
1270 | |
1271 <sect2 id="menc-feat-dvd-mpeg4-interlacing"> | |
1272 <title>Чересстрочная развёртка и телесин</title> | |
1273 | |
1274 <para> | |
1275 Почти все фильмы снимаются при 24 fps [кадр/сек]. Поскольку | |
1276 в NTSC ниспользуется 30000/1001 fps, нужно выполнить некоторую | |
1277 обработку для такого 24 fps видео, чтобы оно корректно | |
1278 воспроизводилось при кадровой частоте NTSC. Этот процесс называется | |
1279 3:2 пулдаун, обычно называемый телесин (поскольку пулдаун часто | |
1280 применяется в процессе показа телевизионного фильма, англ. telecine); | |
1281 и в упрощенном описании это работает путём замедления фильма до | |
1282 24000/1001 fps и повтора каждого четвёртого кадра. | |
1283 </para> | |
1284 | |
1285 <para> | |
1286 Однако, никакой специальной обработки не выполняется для видео | |
1287 на PAL DVD, которое воспроизводится при 25 fps. (Технически PAL | |
1288 может быть подверженым телесину, называемому 2:2 пулдаун, но на | |
1289 практике это не применяется). | |
1290 24 fps фильм просто проигрывается на 25 fps. В результате фильм | |
1291 воспроизводится слегка быстрее, но если Вы не пришелец, то, | |
1292 вероятно, не заметите разницы. | |
1293 У большинства PAL DVD аудио корректируемо по высоте звука, так | |
1294 что, воспроизводясь при 25 fps, оно звучит нормально, даже если | |
1295 аудиодорожка (и, следовательно, весь фильм) проигрываются на | |
1296 4% быстрее, чем NTSC DVD. | |
1297 </para> | |
1298 | |
1299 <para> | |
1300 Поскольку видео на PAL DVD не переделывается, Вам не стоит | |
1301 беспокоится о частоте кадров. У источника 25 fps и у Вашего | |
1302 рипа будет 25 fps. Однако, если Вы делаете рип NTSC DVD фильма, | |
1303 Вам, быть может, придётся выполнить обратный телесин. | |
1304 </para> | |
1305 | |
1306 <para> | |
1307 Для фильмов, снятых на 24 fps, видео на NTSC DVD идёт либо с телесином | |
1308 30000/1001, либо с построчной развёрткой 24000/1001 fps и | |
1309 предназначается для телесина на лету с помощью DVD плеера. | |
1310 С другой стороны, TV сериалы идут обычно только с чересстрочной развёрткой, | |
1311 но без телесина. Это не строгое правило: есть сериалы с | |
1312 чересстрочной развёрткой (например, Баффи, Убийца Вампиров | |
1313 [Buffy the Vampire Slayer]), в то время как другие представляют | |
1314 собой смесь построчной и чересстрочной развёртки (такие как | |
1315 Ангел [Angel] или 24). | |
1316 </para> | |
1317 | |
1318 <para> | |
1319 Настоятельно рекомендуется прочитать раздел о | |
1320 <link linkend="menc-feat-telecine">работе с телесином и чересстрочной развёрткой в NTSC DVD</link> | |
1321 для изучения способов обработки в разных ситуациях. | |
1322 </para> | |
1323 | |
1324 <para> | |
1325 Однако, если Вы преимущественно делаете рипы фильмов, Вы, скорее | |
1326 всего, имеете дело с 24 fps видео либо с построчной развёрткой, | |
1327 либо с подвергнутым телесину; в последнем случае Вы можете использовать | |
1328 <option>pullup</option> фильтр: <option>-vf | |
1329 pullup,softskip</option>. | |
1330 </para> | |
1331 | |
1332 </sect2> | |
1333 | |
1334 <sect2 id="menc-feat-dvd-mpeg4-encoding-interlaced"> | |
1335 <title>Кодирование чересстрочного видео</title> | |
1336 | |
1337 <para> | |
1338 Если Вы желаете кодировать фильм с чересстрочной развёрткой | |
1339 (NTSC или PAL видео), Вам нужно решить, будете ли Вы его | |
1340 преобразовывать в построчную развёртку или нет. | |
1341 Хотя такое преобразование (деинтерлейс) сделает Ваш фильм | |
1342 пригодным для дисплеев с построчной развёрткой, таких как | |
1343 компьютерные мониторы и проекторы, это будет иметь свою цену: | |
1344 частота полей уменьшится вдвое от 50 или 60000/1001 до 25 или | |
1345 30000/1001 поля в секунду, и примерно половина информации в | |
1346 Вашем фильме будет потеряна в сценах со значительным движением. | |
1347 </para> | |
1348 | |
1349 <para> | |
1350 Поэтому, если Вы кодируете для высококачественных архивных целей, | |
1351 не рекомендуется делать деинтерлейс. Вы всегда можете преобразовать | |
1352 развёртку фильма в процессе воспроизведения (при воспроизведении | |
1353 на устройствах с построчной развёрткой). | |
1354 Мощность современных компьютеров вынуждает плееры использовать | |
1355 фильтр деинтерлейса, что слегка ухудшает качество изображения. | |
1356 Но плееры будущего будут способны имитировать дисплей TV с | |
1357 чересстрочной развёрткой, выполняя деинтерлейс на полной частоте | |
1358 полей и интерполируя 50 или 60000/1001 кадров в секунду для | |
1359 чересстрочного видео. | |
1360 </para> | |
1361 | |
1362 <para> | |
1363 С чересстрочным видео нужно работать особым образом: | |
1364 </para> | |
1365 | |
1366 <orderedlist> | |
1367 <listitem><para> | |
1368 Высота усечения и смещение по оси y должны быть кратны 4. | |
1369 </para></listitem> | |
1370 <listitem><para> | |
1371 Любое вертикальное масштабирование должно выполняться в режиме | |
1372 чересстрочной развёртки. | |
1373 </para></listitem> | |
1374 <listitem><para> | |
1375 Фильтры постобработки и удаления шума могут не работать как | |
1376 ожидается, только если Вы особо не позаботитесь об их | |
1377 одновременном применении на частоте полей, иначе они могут | |
1378 повредить видео при неверном использовании. | |
1379 </para></listitem> | |
1380 </orderedlist> | |
1381 | |
1382 <para> | |
1383 Учитывая вышесказанное, вот наш первый пример: | |
1384 </para> | |
1385 <screen> | |
1386 mencoder <replaceable>захват.avi</replaceable> -mc 0 -oac lavc -ovc lavc -lavcopts \ | |
1387 vcodec=mpeg2video:vbitrate=6000:ilme:ildct:acodec=mp2:abitrate=224 | |
1388 </screen> | |
1389 <para> | |
1390 Обратите внимание на опции <option>ilme</option> и <option>ildct</option>. | |
1391 </para> | |
1392 </sect2> | |
1393 | |
1394 | |
1395 <sect2 id="menc-feat-dvd-mpeg4-av-sync"> | |
1396 <title>Замечания об аудио/видео синхронизации</title> | |
1397 | |
1398 <para> | |
1399 Алгоритмы аудио/видео (A/V) синхронизации <application>MEncoder</application> | |
1400 были разработаны с целью восстановления файлов с повреждённой | |
1401 синхронизацией. | |
1402 Однако, в ряде случаев они могут привести к ненужному пропуску | |
1403 или повторению кадров и, возможно, к лёгкой A/V десинхронизации | |
1404 корректных входных данных (конечно, проблемы A/V синхронизации | |
1405 возникают только при обработке или копировании аудиотрека при | |
1406 кодировании видео, что настоятельно рекомендуется). | |
1407 Поэтому Вы можете переключиться на базовую A/V синхронизацию | |
1408 с помощью опции <option>-mc 0</option> или разместить это в | |
1409 конфигурационном файле <systemitem>~/.mplayer/mencoder</systemitem>, | |
1410 если Вы работаете только с хорошими источниками (DVD, TV-захват, | |
1411 высококачественные MPEG-4 рипы и т.п.), а не с повреждёнными | |
1412 файлами ASF/RM/MOV. | |
1413 </para> | |
1414 <para> | |
1415 Если Вы хотите дополнительно защититься от странных пропусков | |
1416 и повторений кадров, вы можете одновременно использовать опции | |
1417 <option>-mc 0</option> и <option>-noskip</option>. | |
1418 Это предотвратит <emphasis>любую</emphasis> A/V коррекцию, и | |
1419 будет копировать кадры один в один, так что Вы не сможете это | |
1420 использовать, если будете применять какие-либо фильтры, которые | |
1421 непредсказуемо добавляют или отбрасывают кадры, либо если у | |
1422 Вашего входного файла переменный битопоток! | |
1423 Поэтому использование <option>-noskip</option> в общем случае не | |
1424 рекомендуется. | |
1425 </para> | |
1426 <para> | |
1427 Сообщалось о том, что так называемое трёхпроходное аудиокодирование, | |
1428 поддерживаемое <application>MEncoder</application>, вызывало | |
1429 A/V десинхронизацию. | |
1430 Это наверняка произойдёт при использовании совместно с некоторыми | |
1431 фильтрами, поэтому сейчас <emphasis>не</emphasis> рекомендуется | |
1432 использовать трёхпроходный аудио режим. | |
1433 Эта возможность оставлена только для совместимости и для опытных | |
1434 пользователей, понимающих когда это безопасно, а когда нет. | |
1435 Если Вы ранее никогда не слышали о трёхпроходном режиме, забудьте | |
1436 даже о том, что мы его упоминали! | |
1437 </para> | |
1438 <para> | |
1439 Также были сообщения об A/V десинхронизации при кодировании | |
1440 со стандартного ввода (stdin) с помощью <application>MEncoder</application>. | |
1441 Не делайте этого! Всегда взамен используйте файл или CD/DVD и т.п. | |
1442 устройство. | |
1443 </para> | |
1444 </sect2> | |
1445 | |
1446 <sect2 id="menc-feat-dvd-mpeg4-codec"> | |
1447 <title>Выбор видеокодека</title> | |
1448 | |
1449 <para> | |
1450 То, какой видеокодек лучше выбрать, зависит от нескольких | |
1451 факторов, таких как размер, качество, устойчивость к ошибкам, | |
1452 практичность и распостранённость, многие из которых сильно | |
1453 зависят от личных предпочтений и технических ограничений. | |
1454 </para> | |
1455 <itemizedlist> | |
1456 <listitem><para> | |
1457 <emphasis role="bold">Эффективность сжатия</emphasis>: | |
1458 Достаточно очевидно, что большинство кодеков нового поколения | |
1459 разработаны для увеличения качества и степени сжатия. | |
1460 Поэтому, авторы данного руководства и многие другие люди полагают, | |
1461 что Вы не можете ошибиться | |
1462 <footnote id='fn-menc-feat-dvd-mpeg4-codec-cpu'> | |
1463 <para> | |
1464 Несмотря на это, будьте осторожны: для декодирования MPEG-4 AVC | |
1465 видео с DVD разрешением необходима быстрая машина (например, | |
1466 Pentium 4 свыше 1.5 ГГц или Pentium M свыше 1 ГГц). | |
1467 </para></footnote>, | |
1468 выбирая MPEG-4 AVC кодеки (например, | |
1469 <systemitem class="library">x264</systemitem>) | |
1470 вместо таких MPEG-4 ASP кодеков, как | |
1471 <systemitem class="library">libavcodec</systemitem> MPEG-4 или | |
20879 | 1472 <systemitem class="library">Xvid</systemitem>. |
20725 | 1473 (Опытные разработчики кодеков могут быть заинтересованы в |
1474 ознакомлении с точкой зрения Михаэля Найдермауэра (Michael | |
1475 Niedermayer) | |
1476 "<ulink url="http://guru.multimedia.cx/?p=10">почему MPEG4-ASP отстой</ulink>".) | |
1477 Аналогично, Вы должны получить лучшее качество с MPEG-4 ASP, по | |
1478 сравнению с MPEG-2 кодеками. | |
1479 </para> | |
1480 <para> | |
1481 Однако, новые кодеки, находящиеся в интенсивной разработке, | |
1482 могут страдать от ещё не замеченных ошибок, которые могут | |
1483 испортить кодирование. Просто это плата за использование | |
1484 передовых технологий. | |
1485 </para> | |
1486 <para> | |
1487 Более существенно то, что для начала использования нового кодека | |
1488 необходимо потратить время на изучение его опций так, чтобы Вы | |
1489 знали, что нужно подстраивать для достижения заданного качества | |
1490 изображения. | |
1491 </para></listitem> | |
1492 | |
1493 <listitem><para> | |
1494 <emphasis role="bold">Аппаратная совместимость</emphasis>: | |
1495 Обычно необходимо длительное время для включения поддержки | |
1496 последних видеокодеков в автономные видеоплееры. | |
1497 В итоге, большинство поддерживает только MPEG-1 (наподобие | |
1498 VCD, XVCD и KVCD), MPEG-2 (например, DVD, SVCD и KVCD) и MPEG-4 | |
1499 ASP (например, DivX, | |
1500 <systemitem class="library">libavcodec</systemitem> LMP4 и | |
20879 | 1501 <systemitem class="library">Xvid</systemitem>) |
20725 | 1502 (Осторожно: обычно поддерживаются не все возможности MPEG-4 ASP). |
1503 Пожалуйста, обратитесь к технической спецификации Вашего плеера | |
1504 (если она доступна) или к гугл (google) для детальной информации. | |
1505 </para></listitem> | |
1506 | |
1507 <listitem><para> | |
1508 <emphasis role="bold">Лучшее соотношение качества и времени кодирования</emphasis>: | |
1509 Кодеки, уже использующиеся определённое время (например, | |
1510 <systemitem class="library">libavcodec</systemitem> MPEG-4 и | |
20879 | 1511 <systemitem class="library">Xvid</systemitem>) обычно сильно |
20725 | 1512 оптимизированы всевозможными остроумными алгоритмами и |
1513 ассемблерным SIMD кодом. Поэтому они обладают тенденцией | |
1514 достижения лучшего соотношения качества к времени кодирования. | |
1515 Однако, у них могут быть некоторые очень продвинутые опции, | |
1516 которые, будучи включенными, сделают кодирование очень медленным | |
1517 ради несущественного выигрыша. | |
1518 </para> | |
1519 <para> | |
1520 Если Вам нужна высокая скорость, примерно придерживайтесь настроек | |
1521 видеокодека по умолчанию (хотя Вам стоит попробовать другие опции, | |
1522 упоминаемые в иных разделах данного руководства). | |
1523 </para> | |
1524 <para> | |
1525 Вы так же можете рассмотреть вариант использования многопоточного | |
1526 кодека, хотя это полезно только для пользователей машин с | |
1527 несколькими процессорами. | |
1528 <systemitem class="library">libavcodec</systemitem> MPEG-4 позволяет | |
1529 это, но выигрыш в скорости ограничен и есть небольшой отрицательный | |
1530 эффект для качества картинки. | |
20879 | 1531 Многопоточное кодирование <systemitem class="library">Xvid</systemitem>, |
20725 | 1532 включаемое опцией <option>threads</option>, может использоваться для |
1533 ускорения кодирования (на примерно 40-60% в типичных случаях) | |
1534 с небольшим ухудшением картинки или вообще без него. | |
1535 <systemitem class="library">x264</systemitem> также позволяет | |
1536 многопоточное кодирование, что обычно ускоряет процесс на 15-30% | |
1537 (в зависимости от настроек кодирования) с уменьшением PSNR примерно | |
1538 на 0.05 дБ. | |
1539 </para></listitem> | |
1540 | |
1541 <listitem><para> | |
1542 <emphasis role="bold">Личные предпочтения</emphasis>: | |
1543 Здесь всё становится почти неразумным: из-за тех же причин, по | |
1544 которым одни придерживаются DivX 3 в течении лет, в то время | |
1545 как новые кодеки уже творят чудеса, другие люди предпочитают | |
20879 | 1546 <systemitem class="library">Xvid</systemitem> или |
20725 | 1547 <systemitem class="library">libavcodec</systemitem> MPEG-4 |
1548 использованиию <systemitem class="library">x264</systemitem>. | |
1549 </para> | |
1550 <para> | |
1551 Вам нужно принимать решение самостоятельно; не слушайте советов | |
1552 людей, признающих только один кодек. | |
1553 Сделайте несколько образцов клипов из искомых источников и | |
1554 сравните разные опции кодирования и кодеки, с целью выбора | |
1555 того, что Вам наиболее подходит. | |
1556 Лучший кодек — это тот, которым Вы сами овладели, и | |
1557 который выглядит лучше всего для Ваших глаз на Вашем дисплее | |
1558 <footnote id='fn-menc-feat-dvd-mpeg4-codec-playback'> | |
1559 <para> | |
1560 Один и тот же результат кодирования может не выглядеть таким же | |
1561 на чьём-либо другом мониторе или при воспроизведении с помощью | |
1562 другого декодера, так что проверяйте Ваши результаты кодирования | |
1563 на жизнеспособность, воспроизводя их в разных начальных условиях. | |
1564 </para></footnote>! | |
1565 </para></listitem> | |
1566 </itemizedlist> | |
1567 <para> | |
1568 Пожалуйста, обратитесь к разделу | |
1569 <link linkend="menc-feat-selecting-codec">выбор кодеков и форматов контейнера</link> | |
1570 для получения списка поддерживаемых кодеков. | |
1571 </para> | |
1572 </sect2> | |
1573 | |
1574 <sect2 id="menc-feat-dvd-mpeg4-audio"> | |
1575 <title>Аудио</title> | |
1576 | |
1577 <para> | |
1578 Аудио — это гораздо более простая проблема: если Вы | |
1579 беспокоитесь о качестве, просто оставьте всё как есть. | |
1580 Даже потоки AC3 5.1 не более чем 448 Кбит/с и они стоят каждого | |
1581 бита. Вы можете соблазниться перекодированием аудио в | |
1582 высококачественный Vorbis (он же ogg формат), но лишь то, что | |
1583 у Вас сегодня нет A/V приёмника для пропускания AC3, не означает, | |
1584 что у Вас не будет его завтра. Для жизнеспособности Ваших DVD | |
1585 рипов в будущем, сохраняйте поток AC3. | |
1586 Вы можете сохранить поток AC3, копируя его непосредственно в | |
1587 видеопоток <link linkend="menc-feat-mpeg4">в процессе кодирования</link>. | |
1588 Вы также можете извлечь AC3 поток с целью мультиплексирования его | |
1589 в контейнеры наподобие NUT или Matroska (Матрёшка). | |
1590 <screen> | |
1591 mplayer <replaceable>файл_источника.vob</replaceable> -aid 129 -dumpaudio -dumpfile <replaceable>звук.ac3</replaceable></screen> | |
1592 сохранит в файл <replaceable>звук.ac3</replaceable> аудиодорожку | |
1593 с номером 129 из файла | |
1594 <replaceable>файл_источника.vob</replaceable> (Обратите внимание: | |
1595 DVD VOB файлы обычно импользуют нумерацию аудио, отличную от | |
1596 стандартной, что означает, что аудиодорожка VOB 129 — это вторая | |
1597 аудиодорожка файла). | |
1598 </para> | |
1599 | |
1600 <para> | |
1601 Но иногда у Вас действительно нет иного выбора, чем далее сжимать | |
1602 звук для того, чтоб больше битов могло быть потрачено на видео. | |
1603 Большинство людей предпочитают сжимать звук с помощью MP3 или | |
1604 Vorbis аудиокодеков. | |
1605 Последний является очень эффективным, но MP3 лучше поддерживается | |
1606 аппаратными плеерами, хотя эта тенденция меняется. | |
1607 </para> | |
1608 | |
1609 <para> | |
1610 <emphasis>Не</emphasis> используйте <option>-nosound</option> при | |
1611 кодировании файла с аудио, даже если Вы будете позже кодировать и | |
1612 мультеплексировать аудио отдельно. | |
1613 Хотя это может работать в идеальных случаях, использование | |
1614 <option>-nosound</option> обычно скрывает ряд проблем в Ваших | |
1615 настройках кодирования в командной строке. | |
1616 Другими словами, наличие звуковой дорожки в процессе кодирования | |
1617 гарантирует Вам, что в случае отсутствия сообщений, подобных | |
1618 <quote>Слишком много аудиопакетов в буфере</quote>, у Вас будет | |
1619 получена правильная синхронизация. | |
1620 </para> | |
1621 | |
1622 <para> | |
1623 Вам необходим <application>MEncoder</application> для обработки | |
1624 звука. | |
1625 Например, Вы можете копировать исходную звуковую дорожку в | |
1626 процессе кодирования с помощью <option>-oac copy</option> или | |
1627 преобразовать её в "лёгкий" 4 кГц моно WAV PCM с помощью | |
1628 <option>-oac pcm -channels 1 -srate 4000</option>. | |
1629 Иначе, в ряде случаев, будет создаваться видео файл, | |
1630 десинхронизированный с аудио. | |
1631 Такие случаи происходят, когда число кадров видео исходного файла | |
1632 не совпадает с полной длиной кадров аудио, или когда были | |
1633 разрывы/сшивания потока, где появились пропущенные или излишние | |
1634 аудиокадры. | |
1635 Правильным решением подобных проблем является вставка тишины или | |
1636 усечение аудио в таких точках. | |
1637 Однако, <application>MPlayer</application> не может это сделать | |
1638 и если Вы демультиплексируете AC3 аудио и кодируете его отдельным | |
1639 приложением (или создаёте дамп в PCM с помощью | |
1640 <application>MPlayer</application>), сшивания останутся | |
1641 нескорректированными и единственный испособ их исправить — | |
1642 пропускать/дублировать видеокадры в местах сшивки. | |
1643 Пока <application>MEncoder</application> видит аудио при | |
1644 кодировании видео, он может выполнять этот пропуск/дублирование | |
1645 (что обычно не вызывыет проблем, т.к. происходит при полностью | |
1646 чёрных кадрах или при смене сцен), но если | |
1647 <application>MEncoder</application> не доступно аудио, он просто | |
1648 будет обрабатывать все кадры "как есть" и они не будут совпадать | |
1649 с окончательным аудиопотоком, когда Вы, например, объедините | |
1650 аудио и видео дорожки в Matroska файл. | |
1651 </para> | |
1652 | |
1653 <para> | |
1654 Прежде всего, Вам необходимо преобразовать DVD звук в WAV файл, | |
1655 который может использоваться аудиокодеком в качестве входных | |
1656 данных. Например: | |
1657 <screen> | |
1658 mplayer <replaceable>исходный_файл.vob</replaceable> \ | |
1659 -ao pcm:file=<replaceable>звук.wav</replaceable> -vc dummy -aid 1 -vo null</screen> | |
1660 сохранит вторую аудиодорожку из файла | |
1661 <replaceable>исходный_файл.vob</replaceable> в файл | |
1662 <replaceable>звук.wav</replaceable>. | |
1663 Возможно, Вы захотите нормализировать звук перед кодированием, | |
1664 поскольку аудиодорожки DVD обычно записываются с маленькой | |
1665 громкостью. | |
1666 Вы можете использовать, например, утилиту <application>normalize</application>, | |
1667 доступную в большинстве дистрибутивов. | |
1668 Если вы пользуетесь Window$, утилита <application>BeSweet</application> | |
1669 делает то же самое. | |
1670 Вы можете сжать в Vorbis или MP3. Например: | |
1671 <screen>oggenc -q1 <replaceable>звук.wav</replaceable></screen> | |
1672 кодирует <replaceable>звук.wav</replaceable> с качеством 1, | |
1673 что примерно эквивалентно 80 Кб/с и является минимальным качеством, | |
1674 при котором Вам нужно кодировать, если Вы заботитесь о качестве. | |
1675 Пожалуйста, обратите внимание, что <application>MEncoder</application> | |
1676 на данный момент не поддерживает мультиплексирование аудиопотоков | |
1677 Vorbis в выходной файл, поскольку он поддерживает только AVI и | |
1678 MPEG контейнеры для выходных файлов, использование каждого из | |
1679 которых может привести к проблемам A/V синхронизации с | |
1680 некоторыми плеерами, в случае когда AVI файл содержит VBR | |
1681 аудиопотоки наподобие Vorbis. | |
1682 Не беспокойтесь, в данном документе будет рассказано как Вы | |
1683 можете это сделать с помощью сторонних программ. | |
1684 </para> | |
1685 | |
1686 </sect2> | |
1687 | |
1688 | |
1689 <sect2 id="menc-feat-dvd-mpeg4-muxing"> | |
1690 <title>Мультиплексирование</title> | |
1691 <para> | |
1692 Теперь, после того как Вы кодировали видео, скорее всего, Вы | |
1693 захотите мультиплексировать его с одним или несколькими | |
1694 аудиопотоками в такие видео контейнеры как AVI, MPEG, | |
1695 Matroska или NUT. | |
1696 На данный момент встроенная поддержка вывода аудио и видео в | |
1697 <application>MEncoder</application> есть только для форматов | |
1698 контейнеров MPEG и AVI. | |
1699 Например: | |
1700 <screen> | |
1701 mencoder -oac copy -ovc copy -o <replaceable>выходной_фильм.avi</replaceable> \ | |
1702 -audiofile <replaceable>исходный_звук.mp2</replaceable> <replaceable>исходное_видео.avi</replaceable></screen> | |
1703 Это объединит видеофайл <replaceable>исходное_видео.avi</replaceable> | |
1704 и аудиофайл <replaceable>исходный_звук.mp2</replaceable> | |
1705 в AVI файл <replaceable>выходной_фильм.avi</replaceable>. | |
1706 Эта команда работает с MPEG-1 слой I, II и III (более | |
1707 известный как MP3) аудио, WAV, а также с некоторыми иными | |
1708 форматами аудио. | |
1709 </para> | |
1710 | |
1711 <para> | |
1712 <application>MEncoder</application> | |
1713 обладает экспериментальной поддержкой | |
1714 <systemitem class="library">libavformat</systemitem> — | |
1715 библиотеки из проекта FFmpeg, поддерживающей мультиплексирование | |
1716 и демультиплексирование множества контейнеров. | |
1717 Например: | |
1718 <screen> | |
1719 mencoder -oac copy -ovc copy -o <replaceable>выходной_фильм.asf</replaceable> \ | |
1720 -audiofile <replaceable>исходный_звук.mp2</replaceable> <replaceable>исходное_видео.avi</replaceable> \ | |
1721 -of lavf -lavfopts format=asf</screen> | |
1722 Это сделает то же самое, что и предыдущий пример, но выходным | |
1723 контейнером будет ASF. | |
1724 Пожалуйста, обратите внимание, что эта поддержка весьма | |
1725 экспериментальна (но становится лучше c каждым днём), и будет | |
1726 работать только в случае компиляции <application>MPlayer</application> | |
1727 с включенной поддержкой | |
1728 <systemitem class="library">libavformat</systemitem> (что означает, | |
1729 что в большинстве случаев бинарная версия из пакетов не будет | |
1730 работать). | |
1731 </para> | |
1732 | |
1733 | |
1734 <sect3 id="menc-feat-dvd-mpeg4-muxing-filter-issues"> | |
1735 <title>Улучшение мультиплексирования и надёжности A/V синхронизации</title> | |
1736 <para> | |
1737 Вы можете столкнуться с некоторыми серьёзными проблемами A/V | |
1738 синхронизации при попытке мультиплексирования вашего видео | |
1739 с некоторыми аудиодорожками, где, как бы Вы не подбирали задержку | |
1740 аудио, никогда не получается правильная синхронизация. | |
1741 Это может происходить при использовании некоторых видеофильтров, | |
1742 пропускающих или дублирующих некоторые кадры, например фильтров | |
1743 обратного телесина. | |
1744 Настоятельно рекомендуется добавлять видеофильтр | |
1745 <option>harddup</option> в конце цепочки фильтров для избежания | |
1746 подобных проблем. | |
1747 </para> | |
1748 | |
1749 <para> | |
1750 Без опции <option>harddup</option>, в случае когда | |
1751 <application>MEncoder</application> хочет дублировать кадр, он | |
1752 полагается на то, что мультиплексор расположит отметку в | |
1753 контейнере таким образом, что последний кадр будет повторен для | |
1754 достижения синхронизации без реальной записи кадра. | |
1755 С опцией <option>harddup</option>, <application>MEncoder</application> | |
1756 вместо этого просто ещё раз поместит последний кадр в цепочку | |
1757 фильтров. | |
1758 Это означает, что кодер получит <emphasis>точно</emphasis> | |
1759 такой же кадр дважды и сожмёт его. | |
1760 Это приведёт у несколько большему файлу, но избавит от проблем | |
1761 при демультиплексировании или ремультиплексировании с другими | |
1762 форматами контейнеров. | |
1763 </para> | |
1764 | |
1765 <para> | |
1766 Также у Вас может не быть иного выбора, как использовать | |
1767 <option>harddup</option> с форматами контейнеров, которые | |
1768 не слишком плотно связаны с | |
1769 <application>MEncoder</application>, например, с форматами, | |
1770 поддерживаемыми с помощью | |
1771 <systemitem class="library">libavformat</systemitem>, | |
1772 которые могут не поддерживать дублирование кадров на уровне | |
1773 контейнера. | |
1774 </para> | |
1775 </sect3> | |
1776 | |
1777 | |
1778 <sect3 id="menc-feat-dvd-mpeg4-muxing-avi-limitations"> | |
1779 <title>Ограничения контейнера AVI</title> | |
1780 <para> | |
1781 Хотя это самый широко распостранённый формат контейнера после | |
1782 MPEG-1, он также обладает некоторыми существенными недостатками. | |
1783 Пожалуй, они наиболее очевидны в его избыточности. | |
1784 Для каждой цепочки AVI файла теряется 24 байта на заголовки и | |
1785 индекс. | |
1786 Это приводит к чуть более 5 МБ/час или 1.0-2.5% избыточности | |
1787 для 700 МБ фильма. Это не кажется большим, но может означать | |
1788 разницу между возможностью использования 700 кбит/сек или | |
1789 714 кбит/сек в случаях, когда каждый бит на счету. | |
1790 </para> | |
1791 | |
1792 <para> | |
1793 В дополнение к малой эффективности, AVI также обладает следующими | |
1794 серьёзными ограничениями: | |
1795 </para> | |
1796 | |
1797 <orderedlist> | |
1798 <listitem> | |
1799 <para> | |
1800 Может быть сохранено только содержимое с фиксированной частотой | |
1801 кадров. В частности, это особенно ограничивает, когда Ваш | |
1802 исходный материал смешанного содержимого: например, является | |
1803 смесью NTSC видео и киноматериала. | |
1804 В действительности, есть хаки, позволяющие сохранять содержимое | |
1805 с переменным fps в AVI, но они увеличивают (и без того большую) | |
1806 избыточность впятеро или более того и поэтому непрактичны. | |
1807 </para> | |
1808 </listitem> | |
1809 <listitem> | |
1810 <para> | |
1811 Аудио в AVI файлах должно быть или с постоянным битпотоком (CBR) | |
1812 или с постоянным размером кадра (т.е. все кадры декодируются | |
1813 в одно и то же число выборок). | |
1814 К сожалению, самый эффективный кодек, Vorbis, не удовлетворяет | |
1815 ни одному из данных требований. | |
1816 Поэтому, если Вы планируете сохранять Ваш фильм в AVI, Вы должны | |
1817 использовать менее эффективный кодек, такой как MP3 или AC3. | |
1818 </para> | |
1819 </listitem> | |
1820 </orderedlist> | |
1821 | |
1822 <para> | |
1823 Сказав всё это, отметим, что <application>MEncoder</application> | |
1824 на данный момент не поддерживает вывод с переменным fps или | |
1825 Vorbis кодирование. | |
1826 Поэтому Вы можете не рассматривать всё это как ограничения, если | |
1827 <application>MEncoder</application> — это единственный | |
1828 инструмент, который Вы используете для кодирования. | |
1829 Однако, возможно использовать <application>MEncoder</application> | |
1830 только для кодирования видео и затем использовать внешние | |
1831 утилиты для кодирования аудио и мультиплексирования его в | |
1832 контейнер другого формата. | |
1833 </para> | |
1834 </sect3> | |
1835 | |
1836 <sect3 id="menc-feat-dvd-mpeg4-muxing-matroska"> | |
1837 <title>Мультиплексирование в контейнер Matroska (Матрёшка)</title> | |
1838 <para> | |
1839 Matroska — это свободный, открытый стандарт формата | |
1840 контейнера, нацеленный на предоставление большого количества | |
1841 продвинутых возможностей, которые старые контейнеры (наподобие | |
1842 AVI) не поддерживают. | |
1843 Например, Matroska поддерживает аудиосодержимое с переменным | |
1844 битпотоком (VBR), переменные частоты кадров (VFR), разделы, | |
1845 файловые вложения, код обнаружения ошибок (EDC) и современные | |
1846 A/V кодеки, такие как "Продвинутое Аудио Кодирование" ("Advanced | |
1847 Audio Coding", AAC), "Vorbis" или "MPEG-4 AVC" (H.264), также | |
1848 не поддерживаемые AVI. | |
1849 </para> | |
1850 | |
1851 <para> | |
1852 Утилиты, необходимые для создания Matroska файлов, сообща | |
1853 называются <application>mkvtoolnix</application>, и доступны | |
1854 для большиства Unix платформ, так же как и для Window$. | |
1855 Поскольку Matroska — открытый формат, Вы можете найти | |
1856 иные утилиты, которые лучше Вам подходят, но поскольку | |
1857 <application>mkvtoolnix</application> — наиболее общие | |
1858 и поддерживаются самой командой разработчиков Matroska, мы | |
1859 будем обсуждать только их использование. | |
1860 </para> | |
1861 | |
1862 <para> | |
1863 Возможно, самым простым способом начать использовать Matroska | |
1864 является использование <application>MMG</application>, | |
1865 графической оболочки, поставляемой с | |
1866 <application>mkvtoolnix</application>. Следуйте | |
1867 <ulink url="http://www.bunkus.org/videotools/mkvtoolnix/doc/mkvmerge-gui.html">руководству к mkvmerge GUI (mmg)</ulink>. | |
1868 </para> | |
1869 | |
1870 <para> | |
1871 Также Вы можете мультиплексировать аудио и видео файлы используя | |
1872 командную строку: | |
1873 <screen> | |
1874 mkvmerge -o <replaceable>выходной_файл.mkv</replaceable> <replaceable>входное_видео.avi</replaceable> \ | |
1875 <replaceable>входное_аудио1.mp3</replaceable> <replaceable>входное_аудио2.ac3</replaceable></screen> | |
1876 Это объединит видеофайл <replaceable>входное_видео.avi</replaceable> | |
1877 и два аудиофайла <replaceable>входное_аудио1.mp3</replaceable> | |
1878 и <replaceable>входное_аудио2.ac3</replaceable> в Matroska | |
1879 файл <replaceable>выходной_файл.mkv</replaceable>. | |
1880 Как было отмечено ранее, Matroska способна реализовать гораздо | |
1881 большее, например, множественные аудиодорожки (включая тонкую | |
1882 настройку аудио/видео синхронизации), разделы, субтитры, | |
1883 разбиение и т.д.. | |
1884 Пожалуйста, обратитесь к документации на эти приложения для | |
1885 деталей. | |
1886 </para> | |
1887 | |
1888 </sect3> | |
1889 | |
1890 </sect2> | |
1891 | |
1892 </sect1> | |
1893 | |
1894 <sect1 id="menc-feat-telecine"> | |
1895 <title>How to deal with telecine and interlacing within NTSC DVDs</title> | |
1896 | |
1897 <sect2 id="menc-feat-telecine-intro"> | |
1898 <title>Introduction</title> | |
1899 <formalpara> | |
1900 <title>What is telecine?</title> | |
1901 <para> | |
1902 If you do not understand much of what is written in this document, | |
1903 read the | |
1904 <ulink url="http://en.wikipedia.org/wiki/Telecine">Wikipedia entry on telecine</ulink>. | |
1905 It is an understandable and reasonably comprehensive | |
1906 description of what telecine is. | |
1907 </para></formalpara> | |
1908 | |
1909 <formalpara> | |
1910 <title>A note about the numbers.</title> | |
1911 <para> | |
1912 Many documents, including the guide linked above, refer to the fields | |
1913 per second value of NTSC video as 59.94 and the corresponding frames | |
1914 per second values as 29.97 (for telecined and interlaced) and 23.976 | |
1915 (for progressive). For simplicity, some documents even round these | |
1916 numbers to 60, 30, and 24. | |
1917 </para></formalpara> | |
1918 | |
1919 <para> | |
1920 Strictly speaking, all those numbers are approximations. Black and | |
1921 white NTSC video was exactly 60 fields per second, but 60000/1001 | |
1922 was later chosen to accomodate color data while remaining compatible | |
1923 with contemporary black and white televisions. Digital NTSC video | |
1924 (such as on a DVD) is also 60000/1001 fields per second. From this, | |
1925 interlaced and telecined video are derived to be 30000/1001 frames | |
1926 per second; progressive video is 24000/1001 frames per second. | |
1927 </para> | |
1928 | |
1929 <para> | |
1930 Older versions of the <application>MEncoder</application> documentation | |
1931 and many archived mailing list posts refer to 59.94, 29.97, and 23.976. | |
1932 All <application>MEncoder</application> documentation has been updated | |
1933 to use the fractional values, and you should use them too. | |
1934 </para> | |
1935 | |
1936 <para> | |
1937 <option>-ofps 23.976</option> is incorrect. | |
1938 <option>-ofps 24000/1001</option> should be used instead. | |
1939 </para> | |
1940 | |
1941 <formalpara> | |
1942 <title>How telecine is used.</title> | |
1943 <para> | |
1944 All video intended to be displayed on an NTSC | |
1945 television set must be 60000/1001 fields per second. Made-for-TV movies | |
1946 4 and shows are often filmed directly at 60000/1001 fields per second, but | |
1947 the majority of cinema is filmed at 24 or 24000/1001 frames per | |
1948 second. When cinematic movie DVDs are mastered, the video is then | |
1949 converted for television using a process called telecine. | |
1950 </para></formalpara> | |
1951 | |
1952 <para> | |
1953 On a DVD, the video is never actually stored as 60000/1001 fields per | |
1954 second. For video that was originally 60000/1001, each pair of fields is | |
1955 combined to form a frame, resulting in 30000/1001 frames per | |
1956 second. Hardware DVD players then read a flag embedded in the video | |
1957 stream to determine whether the odd- or even-numbered lines should | |
1958 form the first field. | |
1959 </para> | |
1960 | |
1961 <para> | |
1962 Usually, 24000/1001 frames per second content stays as it is when | |
1963 encoded for a DVD, and the DVD player must perform telecining | |
1964 on-the-fly. Sometimes, however, the video is telecined | |
1965 <emphasis>before</emphasis> being stored on the DVD; even though it | |
1966 was originally 24000/1001 frames per second, it becomes 60000/1001 fields per | |
1967 second. When it is stored on the DVD, pairs of fields are combined to form | |
1968 30000/1001 frames per second. | |
1969 </para> | |
1970 | |
1971 <para> | |
21018 | 1972 When looking at individual frames formed from 60000/1001 fields per |
20725 | 1973 second video, telecined or otherwise, interlacing is clearly visible |
1974 wherever there is any motion, because one field (say, the | |
1975 even-numbered lines) represents a moment in time 1/(60000/1001) | |
1976 seconds later than the other. Playing interlaced video on a computer | |
1977 looks ugly both because the monitor is higher resolution and because | |
1978 the video is shown frame-after-frame instead of field-after-field. | |
1979 </para> | |
1980 | |
1981 <itemizedlist> | |
1982 <title>Notes:</title> | |
1983 <listitem><para> | |
1984 This section only applies to NTSC DVDs, and not PAL. | |
1985 </para></listitem> | |
1986 <listitem><para> | |
1987 The example <application>MEncoder</application> lines throughout the | |
1988 document are <emphasis role="bold">not</emphasis> intended for | |
1989 actual use. They are simply the bare minimum required to encode the | |
1990 pertaining video category. How to make good DVD rips or fine-tune | |
1991 <systemitem class="library">libavcodec</systemitem> for maximal | |
1992 quality is not within the scope of this document. | |
1993 </para></listitem> | |
1994 <listitem><para> | |
1995 There are a couple footnotes specific to this guide, linked like this: | |
1996 <link linkend="menc-feat-telecine-footnotes">[1]</link> | |
1997 </para></listitem> | |
1998 </itemizedlist> | |
1999 </sect2> | |
2000 | |
2001 <sect2 id="menc-feat-telecine-ident"> | |
2002 <title>How to tell what type of video you have</title> | |
2003 | |
2004 <sect3 id="menc-feat-telecine-ident-progressive"> | |
2005 <title>Progressive</title> | |
2006 <para> | |
2007 Progressive video was originally filmed at 24000/1001 fps, and stored | |
2008 on the DVD without alteration. | |
2009 </para> | |
2010 | |
2011 <para> | |
2012 When you play a progressive DVD in <application>MPlayer</application>, | |
2013 <application>MPlayer</application> will print the following line as | |
2014 soon as the movie begins to play: | |
2015 | |
2016 <screen> demux_mpg: 24000/1001 fps progressive NTSC content detected, switching framerate.</screen> | |
2017 | |
2018 From this point forward, demux_mpg should never say it finds | |
2019 "30000/1001 fps NTSC content." | |
2020 </para> | |
2021 | |
2022 <para> | |
2023 When you watch progressive video, you should never see any | |
2024 interlacing. Beware, however, because sometimes there is a tiny bit | |
2025 of telecine mixed in where you would not expect. I have encountered TV | |
2026 show DVDs that have one second of telecine at every scene change, or | |
2027 at seemingly random places. I once watched a DVD that had a | |
2028 progressive first half, and the second half was telecined. If you | |
2029 want to be <emphasis>really</emphasis> thorough, you can scan the | |
2030 entire movie: | |
2031 | |
2032 <screen>mplayer dvd://1 -nosound -vo null -benchmark</screen> | |
2033 | |
2034 Using <option>-benchmark</option> makes | |
2035 <application>MPlayer</application> play the movie as quickly as it | |
2036 possibly can; still, depending on your hardware, it can take a | |
2037 while. Every time demux_mpg reports a framerate change, the line | |
2038 immediately above will show you the time at which the change | |
2039 occurred. | |
2040 </para> | |
2041 | |
2042 <para> | |
2043 Sometimes progressive video on DVDs is referred to as | |
2044 "soft-telecine" because it is intended to | |
2045 be telecined by the DVD player. | |
2046 </para> | |
2047 </sect3> | |
2048 | |
2049 <sect3 id="menc-feat-telecine-ident-telecined"> | |
2050 <title>Telecined</title> | |
2051 <para> | |
2052 Telecined video was originally filmed at 24000/1001, but was telecined | |
2053 <emphasis>before</emphasis> it was written to the DVD. | |
2054 </para> | |
2055 | |
2056 <para> | |
2057 <application>MPlayer</application> does not (ever) report any | |
2058 framerate changes when it plays telecined video. | |
2059 </para> | |
2060 | |
2061 <para> | |
2062 Watching a telecined video, you will see interlacing artifacts that | |
2063 seem to "blink": they repeatedly appear and disappear. | |
2064 You can look closely at this by | |
2065 <orderedlist> | |
2066 <listitem> | |
2067 <screen>mplayer dvd://1</screen> | |
2068 </listitem> | |
2069 <listitem><para> | |
2070 Seek to a part with motion. | |
2071 </para></listitem> | |
2072 <listitem><para> | |
2073 Use the <keycap>.</keycap> key to step forward one frame at a time. | |
2074 </para></listitem> | |
2075 <listitem><para> | |
2076 Look at the pattern of interlaced-looking and progressive-looking | |
2077 frames. If the pattern you see is PPPII,PPPII,PPPII,... then the | |
2078 video is telecined. If you see some other pattern, then the video | |
2079 may have been telecined using some non-standard method; | |
2080 <application>MEncoder</application> cannot losslessly convert | |
2081 non-standard telecine to progressive. If you do not see any | |
2082 pattern at all, then it is most likely interlaced. | |
2083 </para></listitem> | |
2084 </orderedlist> | |
2085 </para> | |
2086 | |
2087 <para> | |
2088 Sometimes telecined video on DVDs is referred to as | |
2089 "hard-telecine". Since hard-telecine is already 60000/1001 fields | |
2090 per second, the DVD player plays the video without any manipulation. | |
2091 </para> | |
2092 | |
2093 <para> | |
2094 Another way to tell if your source is telecined or not is to play | |
2095 the source with the <option>-vf pullup</option> and <option>-v</option> | |
2096 command line options to see how <option>pullup</option> matches frames. | |
2097 If the source is telecined, you should see on the console a 3:2 pattern | |
2098 with <systemitem>0+.1.+2</systemitem> and <systemitem>0++1</systemitem> | |
2099 alternating. | |
2100 This technique has the advantage that you do not need to watch the | |
2101 source to identify it, which could be useful if you wish to automate | |
2102 the encoding procedure, or to carry out said procedure remotely via | |
2103 a slow connection. | |
2104 </para> | |
2105 | |
2106 </sect3> | |
2107 | |
2108 <sect3 id="menc-feat-telecine-ident-interlaced"> | |
2109 <title>Interlaced</title> | |
2110 <para> | |
2111 Interlaced video was originally filmed at 60000/1001 fields per second, | |
2112 and stored on the DVD as 30000/1001 frames per second. The interlacing effect | |
2113 (often called "combing") is a result of combining pairs of | |
2114 fields into frames. Each field is supposed to be 1/(60000/1001) seconds apart, | |
2115 and when they are displayed simultaneously the difference is apparent. | |
2116 </para> | |
2117 | |
2118 <para> | |
2119 As with telecined video, <application>MPlayer</application> should | |
2120 not ever report any framerate changes when playing interlaced content. | |
2121 </para> | |
2122 | |
2123 <para> | |
2124 When you view an interlaced video closely by frame-stepping with the | |
2125 <keycap>.</keycap> key, you will see that every single frame is interlaced. | |
2126 </para> | |
2127 </sect3> | |
2128 | |
2129 <sect3 id="menc-feat-telecine-ident-mixedpt"> | |
2130 <title>Mixed progressive and telecine</title> | |
2131 <para> | |
2132 All of a "mixed progressive and telecine" video was originally | |
2133 24000/1001 frames per second, but some parts of it ended up being telecined. | |
2134 </para> | |
2135 | |
2136 <para> | |
2137 When <application>MPlayer</application> plays this category, it will | |
2138 (often repeatedly) switch back and forth between "30000/1001 fps NTSC" | |
2139 and "24000/1001 fps progressive NTSC". Watch the bottom of | |
2140 <application>MPlayer</application>'s output to see these messages. | |
2141 </para> | |
2142 | |
2143 <para> | |
2144 You should check the "30000/1001 fps NTSC" sections to make sure | |
2145 they are actually telecine, and not just interlaced. | |
2146 </para> | |
2147 </sect3> | |
2148 | |
2149 <sect3 id="menc-feat-telecine-ident-mixedpi"> | |
2150 <title>Mixed progressive and interlaced</title> | |
2151 <para> | |
2152 In "mixed progressive and interlaced" content, progressive | |
2153 and interlaced video have been spliced together. | |
2154 </para> | |
2155 | |
2156 <para> | |
2157 This category looks just like "mixed progressive and telecine", | |
2158 until you examine the 30000/1001 fps sections and see that they do not have the | |
2159 telecine pattern. | |
2160 </para> | |
2161 </sect3> | |
2162 | |
2163 </sect2> | |
2164 | |
2165 <sect2 id="menc-feat-telecine-encode"> | |
2166 <title>How to encode each category</title> | |
2167 <para> | |
2168 As I mentioned in the beginning, example <application>MEncoder</application> | |
2169 lines below are <emphasis role="bold">not</emphasis> meant to actually be used; | |
2170 they only demonstrate the minimum parameters to properly encode each category. | |
2171 </para> | |
2172 | |
2173 <sect3 id="menc-feat-telecine-encode-progressive"> | |
2174 <title>Progressive</title> | |
2175 <para> | |
2176 Progressive video requires no special filtering to encode. The only | |
2177 parameter you need to be sure to use is | |
2178 <option>-ofps 24000/1001</option>. Otherwise, <application>MEncoder</application> | |
2179 will try to encode at 30000/1001 fps and will duplicate frames. | |
2180 </para> | |
2181 | |
2182 <para> | |
2183 <screen>mencoder dvd://1 -oac copy -ovc lavc -ofps 24000/1001</screen> | |
2184 </para> | |
2185 | |
2186 <para> | |
2187 It is often the case, however, that a video that looks progressive | |
2188 actually has very short parts of telecine mixed in. Unless you are | |
2189 sure, it is safest to treat the video as | |
2190 <link linkend="menc-feat-telecine-encode-mixedpt">mixed progressive and telecine</link>. | |
2191 The performance loss is small | |
2192 <link linkend="menc-feat-telecine-footnotes">[3]</link>. | |
2193 </para> | |
2194 </sect3> | |
2195 | |
2196 <sect3 id="menc-feat-telecine-encode-telecined"> | |
2197 <title>Telecined</title> | |
2198 <para> | |
2199 Telecine can be reversed to retrieve the original 24000/1001 content, | |
2200 using a process called inverse-telecine. | |
2201 <application>MPlayer</application> contains several filters to | |
2202 accomplish this; the best filter, <option>pullup</option>, is described | |
2203 in the <link linkend="menc-feat-telecine-encode-mixedpt">mixed | |
2204 progressive and telecine</link> section. | |
2205 </para> | |
2206 </sect3> | |
2207 | |
2208 <sect3 id="menc-feat-telecine-encode-interlaced"> | |
2209 <title>Interlaced</title> | |
2210 <para> | |
2211 For most practical cases it is not possible to retrieve a complete | |
2212 progressive video from interlaced content. The only way to do so | |
2213 without losing half of the vertical resolution is to double the | |
2214 framerate and try to "guess" what ought to make up the | |
2215 corresponding lines for each field (this has drawbacks - see method | |
2216 3). | |
2217 </para> | |
2218 | |
2219 <orderedlist> | |
2220 <listitem><para> | |
2221 | |
2222 Encode the video in interlaced form. Normally, interlacing wreaks | |
2223 havoc with the encoder's ability to compress well, but | |
2224 <systemitem class="library">libavcodec</systemitem> has two | |
2225 parameters specifically for dealing with storing interlaced video a | |
2226 bit better: <option> ildct</option> and <option>ilme</option>. Also, | |
2227 using <option>mbd=2</option> is strongly recommended | |
2228 <link linkend="menc-feat-telecine-footnotes">[2] </link> because it | |
2229 will encode macroblocks as non-interlaced in places where there is | |
2230 no motion. Note that <option>-ofps</option> is NOT needed here. | |
2231 | |
2232 <screen>mencoder dvd://1 -oac copy -ovc lavc -lavcopts ildct:ilme:mbd=2</screen> | |
2233 </para></listitem> | |
2234 <listitem><para> | |
2235 Use a deinterlacing filter before encoding. There are several of | |
2236 these filters available to choose from, each with its own advantages | |
21134
d3ef4ae45375
r21078: add a link to Michael's de-interlacing filters...
voroshil
parents:
21051
diff
changeset
|
2237 and disadvantages. Consult <option>mplayer -pphelp</option> and |
d3ef4ae45375
r21078: add a link to Michael's de-interlacing filters...
voroshil
parents:
21051
diff
changeset
|
2238 <option>mplayer -vf help</option> to see what is available |
d3ef4ae45375
r21078: add a link to Michael's de-interlacing filters...
voroshil
parents:
21051
diff
changeset
|
2239 (grep for "deint"), read Michael's Niedermayer |
d3ef4ae45375
r21078: add a link to Michael's de-interlacing filters...
voroshil
parents:
21051
diff
changeset
|
2240 <ulink url="http://guru.multimedia.cx/deinterlacing-filters/">Deinterlacing filters comparison</ulink>, |
d3ef4ae45375
r21078: add a link to Michael's de-interlacing filters...
voroshil
parents:
21051
diff
changeset
|
2241 and search the |
21385
70b9b7400bc3
r21372: Some punctuation cosmetics and better wording
voroshil
parents:
21134
diff
changeset
|
2242 <ulink url="http://www.mplayerhq.hu/design7/mailing_lists.html"> |
20725 | 2243 MPlayer mailing lists</ulink> to find many discussions about the |
21134
d3ef4ae45375
r21078: add a link to Michael's de-interlacing filters...
voroshil
parents:
21051
diff
changeset
|
2244 various filters. |
d3ef4ae45375
r21078: add a link to Michael's de-interlacing filters...
voroshil
parents:
21051
diff
changeset
|
2245 Again, the framerate is not changing, so no |
20725 | 2246 <option>-ofps</option>. Also, deinterlacing should be done after |
2247 cropping <link linkend="menc-feat-telecine-footnotes">[1]</link> and | |
2248 before scaling. | |
2249 | |
21134
d3ef4ae45375
r21078: add a link to Michael's de-interlacing filters...
voroshil
parents:
21051
diff
changeset
|
2250 <screen>mencoder dvd://1 -oac copy -vf yadif -ovc lavc</screen> |
20725 | 2251 </para></listitem> |
2252 <listitem><para> | |
2253 Unfortunately, this option is buggy with | |
2254 <application>MEncoder</application>; it ought to work well with | |
2255 <application>MEncoder G2</application>, but that is not here yet. You | |
2256 might experience crahes. Anyway, the purpose of <option> -vf | |
2257 tfields</option> is to create a full frame out of each field, which | |
2258 makes the framerate 60000/1001. The advantage of this approach is that no | |
2259 data is ever lost; however, since each frame comes from only one | |
2260 field, the missing lines have to be interpolated somehow. There are | |
2261 no very good methods of generating the missing data, and so the | |
2262 result will look a bit similar to when using some deinterlacing | |
2263 filters. Generating the missing lines creates other issues, as well, | |
2264 simply because the amount of data doubles. So, higher encoding | |
2265 bitrates are required to maintain quality, and more CPU power is | |
2266 used for both encoding and decoding. tfields has several different | |
2267 options for how to create the missing lines of each frame. If you | |
2268 use this method, then Reference the manual, and chose whichever | |
2269 option looks best for your material. Note that when using | |
2270 <option>tfields</option> you | |
2271 <emphasis role="bold">have to</emphasis> specify both | |
2272 <option>-fps</option> and <option>-ofps</option> to be twice the | |
2273 framerate of your original source. | |
2274 | |
2275 <screen>mencoder dvd://1 -oac copy -vf tfields=2 -ovc lavc -fps 60000/1001 -ofps 60000/1001</screen> | |
2276 </para></listitem> | |
2277 <listitem><para> | |
2278 If you plan on downscaling dramatically, you can extract and encode | |
2279 only one of the two fields. Of course, you will lose half the vertical | |
2280 resolution, but if you plan on downscaling to at most 1/2 of the | |
2281 original, the loss will not matter much. The result will be a | |
2282 progressive 30000/1001 frames per second file. The procedure is to use | |
2283 <option>-vf field</option>, then crop | |
2284 <link linkend="menc-feat-telecine-footnotes">[1]</link> and scale | |
2285 appropriately. Remember that you will have to adjust the scale to | |
2286 compensate for the vertical resolution being halved. | |
2287 <screen>mencoder dvd://1 -oac copy -vf field=0 -ovc lavc</screen> | |
2288 </para></listitem> | |
2289 </orderedlist> | |
2290 </sect3> | |
2291 | |
2292 <sect3 id="menc-feat-telecine-encode-mixedpt"> | |
2293 <title>Mixed progressive and telecine</title> | |
2294 <para> | |
2295 In order to turn mixed progressive and telecine video into entirely | |
2296 progressive video, the telecined parts have to be | |
2297 inverse-telecined. There are three ways to accomplish this, | |
2298 described below. Note that you should | |
2299 <emphasis role="bold">always</emphasis> inverse-telecine before any | |
2300 rescaling; unless you really know what you are doing, | |
2301 inverse-telecine before cropping, too | |
2302 <link linkend="menc-feat-telecine-footnotes">[1]</link>. | |
2303 <option>-ofps 24000/1001</option> is needed here because the output video | |
2304 will be 24000/1001 frames per second. | |
2305 </para> | |
2306 | |
2307 <itemizedlist> | |
2308 <listitem><para> | |
2309 <option>-vf pullup</option> is designed to inverse-telecine | |
2310 telecined material while leaving progressive data alone. In order to | |
2311 work properly, <option>pullup</option> <emphasis role="bold">must</emphasis> | |
2312 be followed by the <option>softskip</option> filter or | |
2313 else <application>MEncoder</application> will crash. | |
2314 <option>pullup</option> is, however, the cleanest and most | |
2315 accurate method available for encoding both telecine and | |
2316 "mixed progressive and telecine". | |
2317 | |
2318 <screen>mencoder dvd://1 -oac copy -vf pullup,softskip -ovc lavc -ofps 24000/1001</screen> | |
2319 </para> | |
2320 | |
2321 | |
2322 </listitem> | |
2323 <listitem><para> | |
2324 An older method | |
2325 is to, rather than inverse-telecine the telecined parts, telecine | |
2326 the non-telecined parts and then inverse-telecine the whole | |
2327 video. Sound confusing? softpulldown is a filter that goes through | |
2328 a video and makes the entire file telecined. If we follow | |
2329 softpulldown with either <option>detc</option> or | |
2330 <option>ivtc</option>, the final result will be entirely | |
2331 progressive. <option>-ofps 24000/1001</option> is needed. | |
2332 | |
2333 <screen>mencoder dvd://1 -oac copy -vf softpulldown,ivtc=1 -ovc lavc -ofps 24000/1001</screen> | |
2334 </para> | |
2335 </listitem> | |
2336 | |
2337 <listitem><para> | |
2338 I have not used <option>-vf filmdint</option> myself, but here is what | |
2339 D Richard Felker III has to say: | |
2340 | |
2341 <blockquote><para>It is OK, but IMO it tries to deinterlace rather | |
2342 than doing inverse telecine too often (much like settop DVD | |
2343 players & progressive TVs) which gives ugly flickering and | |
2344 other artifacts. If you are going to use it, you at least need to | |
2345 spend some time tuning the options and watching the output first | |
2346 to make sure it is not messing up.</para></blockquote> | |
2347 </para></listitem> | |
2348 </itemizedlist> | |
2349 </sect3> | |
2350 | |
2351 <sect3 id="menc-feat-telecine-encode-mixedpi"> | |
2352 <title>Mixed progressive and interlaced</title> | |
2353 <para> | |
2354 There are two options for dealing with this category, each of | |
2355 which is a compromise. You should decide based on the | |
2356 duration/location of each type. | |
2357 </para> | |
2358 | |
2359 <itemizedlist> | |
2360 <listitem><para> | |
2361 Treat it as progressive. The interlaced parts will look interlaced, | |
2362 and some of the interlaced fields will have to be dropped, resulting | |
2363 in a bit of uneven jumpiness. You can use a postprocessing filter if | |
2364 you want to, but it may slightly degrade the progressive parts. | |
2365 </para> | |
2366 | |
2367 <para> | |
2368 This option should definitely not be used if you want to eventually | |
2369 display the video on an interlaced device (with a TV card, for | |
2370 example). If you have interlaced frames in a 24000/1001 frames per | |
2371 second video, they will be telecined along with the progressive | |
2372 frames. Half of the interlaced "frames" will be displayed for three | |
2373 fields' duration (3/(60000/1001) seconds), resulting in a flicking | |
2374 "jump back in time" effect that looks quite bad. If you | |
2375 even attempt this, you <emphasis role="bold">must</emphasis> use a | |
2376 deinterlacing filter like <option>lb</option> or | |
2377 <option>l5</option>. | |
2378 </para> | |
2379 | |
2380 <para> | |
2381 It may also be a bad idea for progressive display, too. It will drop | |
2382 pairs of consecutive interlaced fields, resulting in a discontinuity | |
2383 that can be more visible than with the second method, which shows | |
2384 some progressive frames twice. 30000/1001 frames per second interlaced | |
2385 video is already a bit choppy because it really should be shown at | |
2386 60000/1001 fields per second, so the duplicate frames do not stand out as | |
2387 much. | |
2388 </para> | |
2389 | |
2390 <para> | |
2391 Either way, it is best to consider your content and how you intend to | |
2392 display it. If your video is 90% progressive and you never intend to | |
2393 show it on a TV, you should favor a progressive approach. If it is | |
2394 only half progressive, you probably want to encode it as if it is all | |
2395 interlaced. | |
2396 </para> | |
2397 </listitem> | |
2398 | |
2399 <listitem><para> | |
2400 Treat it as interlaced. Some frames of the progressive parts will | |
2401 need to be duplicated, resulting in uneven jumpiness. Again, | |
2402 deinterlacing filters may slightly degrade the progressive parts. | |
2403 </para></listitem> | |
2404 | |
2405 </itemizedlist> | |
2406 </sect3> | |
2407 | |
2408 </sect2> | |
2409 | |
2410 <sect2 id="menc-feat-telecine-footnotes"> | |
2411 <title>Footnotes</title> | |
2412 <orderedlist> | |
2413 <listitem><formalpara> | |
2414 <title>About cropping:</title> | |
2415 <para> | |
2416 Video data on DVDs are stored in a format called YUV 4:2:0. In YUV | |
2417 video, luma ("brightness") and chroma ("color") | |
2418 are stored separately. Because the human eye is somewhat less | |
2419 sensitive to color than it is to brightness, in a YUV 4:2:0 picture | |
2420 there is only one chroma pixel for every four luma pixels. In a | |
2421 progressive picture, each square of four luma pixels (two on each | |
2422 side) has one common chroma pixel. You must crop progressive YUV | |
2423 4:2:0 to even resolutions, and use even offsets. For example, | |
2424 <option>crop=716:380:2:26</option> is OK but | |
2425 <option>crop=716:380:3:26 </option> is not. | |
2426 </para> | |
2427 </formalpara> | |
2428 | |
2429 <para> | |
2430 When you are dealing with interlaced YUV 4:2:0, the situation is a | |
2431 bit more complicated. Instead of every four luma pixels in the | |
2432 <emphasis>frame</emphasis> sharing a chroma pixel, every four luma | |
2433 pixels in each <emphasis> field</emphasis> share a chroma | |
2434 pixel. When fields are interlaced to form a frame, each scanline is | |
2435 one pixel high. Now, instead of all four luma pixels being in a | |
2436 square, there are two pixels side-by-side, and the other two pixels | |
2437 are side-by-side two scanlines down. The two luma pixels in the | |
2438 intermediate scanline are from the other field, and so share a | |
2439 different chroma pixel with two luma pixels two scanlines away. All | |
2440 this confusion makes it necessary to have vertical crop dimensions | |
2441 and offsets be multiples of four. Horizontal can stay even. | |
2442 </para> | |
2443 | |
2444 <para> | |
2445 For telecined video, I recommend that cropping take place after | |
2446 inverse telecining. Once the video is progressive you only need to | |
2447 crop by even numbers. If you really want to gain the slight speedup | |
2448 that cropping first may offer, you must crop vertically by multiples | |
2449 of four or else the inverse-telecine filter will not have proper data. | |
2450 </para> | |
2451 | |
2452 <para> | |
2453 For interlaced (not telecined) video, you must always crop | |
2454 vertically by multiples of four unless you use <option>-vf | |
2455 field</option> before cropping. | |
2456 </para> | |
2457 </listitem> | |
2458 | |
2459 <listitem><formalpara> | |
2460 <title>About encoding parameters and quality:</title> | |
2461 <para> | |
2462 Just because I recommend <option>mbd=2</option> here does not mean it | |
2463 should not be used elsewhere. Along with <option>trell</option>, | |
2464 <option>mbd=2</option> is one of the two | |
2465 <systemitem class="library">libavcodec</systemitem> options that | |
2466 increases quality the most, and you should always use at least those | |
2467 two unless the drop in encoding speed is prohibitive (e.g. realtime | |
2468 encoding). There are many other options to | |
2469 <systemitem class="library">libavcodec</systemitem> that increase | |
2470 encoding quality (and decrease encoding speed) but that is beyond | |
2471 the scope of this document. | |
2472 </para> | |
2473 </formalpara> | |
2474 </listitem> | |
2475 | |
2476 <listitem><formalpara> | |
2477 <title>About the performance of pullup:</title> | |
2478 <para> | |
2479 It is safe to use <option>pullup</option> (along with <option>softskip | |
2480 </option>) on progressive video, and is usually a good idea unless | |
2481 the source has been definitively verified to be entirely progressive. | |
2482 The performace loss is small for most cases. On a bare-minimum encode, | |
2483 <option>pullup</option> causes <application>MEncoder</application> to | |
2484 be 50% slower. Adding sound processing and advanced <option>lavcopts | |
2485 </option> overshadows that difference, bringing the performance | |
2486 decrease of using <option>pullup</option> down to 2%. | |
2487 </para> | |
2488 </formalpara> | |
2489 </listitem> | |
2490 | |
2491 </orderedlist> | |
2492 | |
2493 </sect2> | |
2494 | |
2495 </sect1> | |
2496 | |
2497 | |
2498 <sect1 id="menc-feat-enc-libavcodec"> | |
2499 <title>Encoding with the <systemitem class="library">libavcodec</systemitem> | |
2500 codec family</title> | |
2501 | |
2502 <para> | |
2503 <link linkend="ffmpeg"><systemitem class="library">libavcodec</systemitem></link> | |
2504 provides simple encoding to a lot of interesting video and audio formats. | |
2505 You can encode to the following codecs (more or less up to date): | |
2506 </para> | |
2507 | |
2508 <sect2 id="menc-feat-enc-libavcodec-video-codecs"> | |
2509 <title><systemitem class="library">libavcodec</systemitem>'s video codecs</title> | |
2510 | |
2511 <para> | |
2512 <informaltable frame="all"> | |
2513 <tgroup cols="2"> | |
2514 <thead> | |
2515 <row><entry>Video codec name</entry><entry>Description</entry></row> | |
2516 </thead> | |
2517 <tbody> | |
2518 <row><entry>mjpeg</entry><entry> | |
2519 Motion JPEG | |
2520 </entry></row> | |
2521 <row><entry>ljpeg</entry><entry> | |
2522 lossless JPEG | |
2523 </entry></row> | |
2524 <row><entry>h261</entry><entry> | |
2525 H.261 | |
2526 </entry></row> | |
2527 <row><entry>h263</entry><entry> | |
2528 H.263 | |
2529 </entry></row> | |
2530 <row><entry>h263p</entry><entry> | |
2531 H.263+ | |
2532 </entry></row> | |
2533 <row><entry>mpeg4</entry><entry> | |
20879 | 2534 ISO standard MPEG-4 (DivX, Xvid compatible) |
20725 | 2535 </entry></row> |
2536 <row><entry>msmpeg4</entry><entry> | |
2537 pre-standard MPEG-4 variant by MS, v3 (AKA DivX3) | |
2538 </entry></row> | |
2539 <row><entry>msmpeg4v2</entry><entry> | |
2540 pre-standard MPEG-4 by MS, v2 (used in old ASF files) | |
2541 </entry></row> | |
2542 <row><entry>wmv1</entry><entry> | |
2543 Windows Media Video, version 1 (AKA WMV7) | |
2544 </entry></row> | |
2545 <row><entry>wmv2</entry><entry> | |
2546 Windows Media Video, version 2 (AKA WMV8) | |
2547 </entry></row> | |
2548 <row><entry>rv10</entry><entry> | |
2549 RealVideo 1.0 | |
2550 </entry></row> | |
2551 <row><entry>rv20</entry><entry> | |
2552 RealVideo 2.0 | |
2553 </entry></row> | |
2554 <row><entry>mpeg1video</entry><entry> | |
2555 MPEG-1 video | |
2556 </entry></row> | |
2557 <row><entry>mpeg2video</entry><entry> | |
2558 MPEG-2 video | |
2559 </entry></row> | |
2560 <row><entry>huffyuv</entry><entry> | |
2561 lossless compression | |
2562 </entry></row> | |
2563 <row><entry>asv1</entry><entry> | |
2564 ASUS Video v1 | |
2565 </entry></row> | |
2566 <row><entry>asv2</entry><entry> | |
2567 ASUS Video v2 | |
2568 </entry></row> | |
2569 <row><entry>ffv1</entry><entry> | |
2570 FFmpeg's lossless video codec | |
2571 </entry></row> | |
2572 <row><entry>svq1</entry><entry> | |
2573 Sorenson video 1 | |
2574 </entry></row> | |
2575 <row><entry>flv</entry><entry> | |
2576 Sorenson H.263 used in Flash Video | |
2577 </entry></row> | |
2578 <row><entry>dvvideo</entry><entry> | |
2579 Sony Digital Video | |
2580 </entry></row> | |
2581 <row><entry>snow</entry><entry> | |
2582 FFmpeg's experimental wavelet-based codec | |
2583 </entry></row> | |
2584 </tbody> | |
2585 </tgroup> | |
2586 </informaltable> | |
2587 | |
2588 The first column contains the codec names that should be passed after the | |
2589 <literal>vcodec</literal> config, like: <option>-lavcopts vcodec=msmpeg4</option> | |
2590 </para> | |
2591 <informalexample> | |
2592 <para> | |
2593 An example with MJPEG compression: | |
2594 <screen>mencoder dvd://2 -o title2.avi -ovc lavc -lavcopts vcodec=mjpeg -oac copy</screen> | |
2595 </para> | |
2596 </informalexample> | |
2597 </sect2> | |
2598 | |
2599 <sect2 id="menc-feat-enc-libavcodec-audio-codecs"> | |
2600 <title><systemitem class="library">libavcodec</systemitem>'s audio codecs</title> | |
2601 <para> | |
2602 <informaltable frame="all"> | |
2603 <tgroup cols="2"> | |
2604 <thead> | |
2605 <row><entry>Audio codec name</entry><entry>Description</entry></row> | |
2606 </thead> | |
2607 <tbody> | |
2608 <row> | |
2609 <entry>mp2</entry> | |
2610 <entry>MPEG Layer 2</entry> | |
2611 </row> | |
2612 <row> | |
2613 <entry>ac3</entry> | |
2614 <entry>AC3, AKA Dolby Digital</entry> | |
2615 </row> | |
2616 <row> | |
2617 <entry>adpcm_ima_wav</entry> | |
2618 <entry>IMA adaptive PCM (4 bits per sample, 4:1 compression)</entry> | |
2619 </row> | |
2620 <row> | |
2621 <entry>sonic</entry> | |
2622 <entry>experimental lossy/lossless codec</entry> | |
2623 </row> | |
2624 </tbody> | |
2625 </tgroup> | |
2626 </informaltable> | |
2627 | |
2628 The first column contains the codec names that should be passed after the | |
2629 <literal>acodec</literal> option, like: <option>-lavcopts acodec=ac3</option> | |
2630 </para> | |
2631 | |
2632 <informalexample> | |
2633 <para> | |
2634 An example with AC3 compression: | |
2635 <screen>mencoder dvd://2 -o title2.avi -oac lavc -lavcopts acodec=ac3 -ovc copy</screen> | |
2636 </para> | |
2637 </informalexample> | |
2638 | |
2639 <para> | |
2640 Contrary to <systemitem class="library">libavcodec</systemitem>'s video | |
2641 codecs, its audio codecs do not make a wise usage of the bits they are | |
2642 given as they lack some minimal psychoacoustic model (if at all) | |
2643 which most other codec implementations feature. | |
2644 However, note that all these audio codecs are very fast and work | |
2645 out-of-the-box everywhere <application>MEncoder</application> has been | |
2646 compiled with <systemitem class="library">libavcodec</systemitem> (which | |
2647 is the case most of time), and do not depend on external libraries. | |
2648 </para> | |
2649 </sect2> | |
2650 | |
2651 | |
2652 <sect2 id="menc-feat-dvd-mpeg4-lavc-encoding-options"> | |
2653 <title>Encoding options of libavcodec</title> | |
2654 | |
2655 <para> | |
2656 Ideally, you would probably want to be able to just tell the encoder to switch | |
2657 into "high quality" mode and move on. | |
2658 That would probably be nice, but unfortunately hard to implement as different | |
2659 encoding options yield different quality results depending on the source material. | |
2660 That is because compression depends on the visual properties of the video | |
2661 in question. | |
2662 For example, anime and live action have very different properties and | |
2663 thus require different options to obtain optimum encoding. | |
2664 The good news is that some options should never be left out, like | |
2665 <option>mbd=2</option>, <option>trell</option>, and <option>v4mv</option>. | |
2666 See below for a detailed description of common encoding options. | |
2667 </para> | |
2668 | |
2669 | |
2670 <itemizedlist> | |
2671 <title>Options to adjust:</title> | |
2672 <listitem><para> | |
2673 <emphasis role="bold">vmax_b_frames</emphasis>: 1 or 2 is good, depending on | |
2674 the movie. | |
2675 Note that if you need to have your encode be decodable by DivX5, you | |
2676 need to activate closed GOP support, using | |
2677 <systemitem class="library">libavcodec</systemitem>'s <option>cgop</option> | |
2678 option, but you need to deactivate scene detection, which | |
2679 is not a good idea as it will hurt encode efficiency a bit. | |
2680 </para></listitem> | |
2681 | |
2682 <listitem><para> | |
2683 <emphasis role="bold">vb_strategy=1</emphasis>: helps in high-motion scenes. | |
2684 On some videos, vmax_b_frames may hurt quality, but vmax_b_frames=2 along | |
2685 with vb_strategy=1 helps. | |
2686 </para></listitem> | |
2687 | |
2688 <listitem><para> | |
2689 <emphasis role="bold">dia</emphasis>: motion search range. Bigger is better | |
2690 and slower. | |
2691 Negative values are a completely different scale. | |
2692 Good values are -1 for a fast encode, or 2-4 for slower. | |
2693 </para></listitem> | |
2694 | |
2695 <listitem><para> | |
2696 <emphasis role="bold">predia</emphasis>: motion search pre-pass. | |
2697 Not as important as dia. Good values are 1 (default) to 4. Requires preme=2 | |
2698 to really be useful. | |
2699 </para></listitem> | |
2700 | |
2701 <listitem><para> | |
2702 <emphasis role="bold">cmp, subcmp, precmp</emphasis>: Comparison function for | |
2703 motion estimation. | |
2704 Experiment with values of 0 (default), 2 (hadamard), 3 (dct), and 6 (rate | |
2705 distortion). | |
2706 0 is fastest, and sufficient for precmp. | |
2707 For cmp and subcmp, 2 is good for anime, and 3 is good for live action. | |
2708 6 may or may not be slightly better, but is slow. | |
2709 </para></listitem> | |
2710 | |
2711 <listitem><para> | |
2712 <emphasis role="bold">last_pred</emphasis>: Number of motion predictors to | |
2713 take from the previous frame. | |
2714 1-3 or so help at little speed cost. | |
2715 Higher values are slow for no extra gain. | |
2716 </para></listitem> | |
2717 | |
2718 <listitem><para> | |
2719 <emphasis role="bold">cbp, mv0</emphasis>: Controls the selection of macroblocks. | |
2720 Small speed cost for small quality gain. | |
2721 </para></listitem> | |
2722 | |
2723 <listitem><para> | |
2724 <emphasis role="bold">qprd</emphasis>: adaptive quantization based on the | |
2725 macroblock's complexity. | |
2726 May help or hurt depending on the video and other options. | |
2727 This can cause artifacts unless you set vqmax to some reasonably small value | |
2728 (6 is good, maybe as low as 4); vqmin=1 should also help. | |
2729 </para></listitem> | |
2730 | |
2731 <listitem><para> | |
2732 <emphasis role="bold">qns</emphasis>: very slow, especially when combined | |
2733 with qprd. | |
2734 This option will make the encoder minimize noise due to compression | |
2735 artifacts instead of making the encoded video strictly match the source. | |
2736 Do not use this unless you have already tweaked everything else as far as it | |
2737 will go and the results still are not good enough. | |
2738 </para></listitem> | |
2739 | |
2740 <listitem><para> | |
2741 <emphasis role="bold">vqcomp</emphasis>: Tweak ratecontrol. | |
2742 What values are good depends on the movie. | |
2743 You can safely leave this alone if you want. | |
2744 Reducing vqcomp puts more bits on low-complexity scenes, increasing it puts | |
2745 them on high-complexity scenes (default: 0.5, range: 0-1. recommended range: | |
2746 0.5-0.7). | |
2747 </para></listitem> | |
2748 | |
2749 <listitem><para> | |
2750 <emphasis role="bold">vlelim, vcelim</emphasis>: Sets the single coefficient | |
2751 elimination threshold for luminance and chroma planes. | |
2752 These are encoded separately in all MPEG-like algorithms. | |
2753 The idea behind these options is to use some good heuristics to determine | |
2754 when the change in a block is less than the threshold you specify, and in | |
2755 such a case, to just encode the block as "no change". | |
2756 This saves bits and perhaps speeds up encoding. vlelim=-4 and vcelim=9 | |
2757 seem to be good for live movies, but seem not to help with anime; | |
2758 when encoding animation, you should probably leave them unchanged. | |
2759 </para></listitem> | |
2760 | |
2761 <listitem><para> | |
2762 <emphasis role="bold">qpel</emphasis>: Quarter pixel motion estimation. | |
2763 MPEG-4 uses half pixel precision for its motion search by default, | |
2764 therefore this option comes with an overhead as more information will be | |
2765 stored in the encoded file. | |
2766 The compression gain/loss depends on the movie, but it is usually not very | |
2767 effective on anime. | |
2768 qpel always incurs a significant cost in CPU decode time (+25% in | |
2769 practice). | |
2770 </para></listitem> | |
2771 | |
2772 <listitem><para> | |
2773 <emphasis role="bold">psnr</emphasis>: does not affect the actual encoding, | |
2774 but writes a log file giving the type/size/quality of each frame, and | |
2775 prints a summary of PSNR (Peak Signal to Noise Ratio) at the end. | |
2776 </para></listitem> | |
2777 | |
2778 </itemizedlist> | |
2779 | |
2780 <itemizedlist> | |
2781 <title>Options not recommended to play with:</title> | |
2782 <listitem><para> | |
2783 <emphasis role="bold">vme</emphasis>: The default is best. | |
2784 </para></listitem> | |
2785 | |
2786 <listitem><para> | |
2787 <emphasis role="bold">lumi_mask, dark_mask</emphasis>: Psychovisual adaptive | |
2788 quantization. | |
2789 You do not want to play with those options if you care about quality. | |
2790 Reasonable values may be effective in your case, but be warned this is very | |
2791 subjective. | |
2792 </para></listitem> | |
2793 | |
2794 <listitem><para> | |
2795 <emphasis role="bold">scplx_mask</emphasis>: Tries to prevent blocky | |
2796 artifacts, but postprocessing is better. | |
2797 </para></listitem> | |
2798 </itemizedlist> | |
2799 </sect2> | |
2800 | |
2801 <sect2 id="menc-feat-mpeg4-lavc-example-settings"> | |
2802 <title>Encoding setting examples</title> | |
2803 | |
2804 <para> | |
2805 The following settings are examples of different encoding | |
2806 option combinations that affect the speed vs quality tradeoff | |
2807 at the same target bitrate. | |
2808 </para> | |
2809 | |
2810 <para> | |
2811 All the encoding settings were tested on a 720x448 @30000/1001 fps | |
2812 video sample, the target bitrate was 900kbps, and the machine was an | |
2813 AMD-64 3400+ at 2400 MHz in 64 bits mode. | |
2814 Each encoding setting features the measured encoding speed (in | |
2815 frames per second) and the PSNR loss (in dB) compared to the "very | |
2816 high quality" setting. | |
2817 Please understand that depending on your source, your machine type | |
2818 and development advancements, you may get very different results. | |
2819 </para> | |
2820 | |
2821 <para> | |
2822 <informaltable frame="all"> | |
2823 <tgroup cols="4"> | |
2824 <thead> | |
2825 <row><entry>Description</entry><entry>Encoding options</entry><entry>speed (in fps)</entry><entry>Relative PSNR loss (in dB)</entry></row> | |
2826 </thead> | |
2827 <tbody> | |
2828 <row> | |
2829 <entry>Very high quality</entry> | |
2830 <entry><option>vcodec=mpeg4:mbd=2:mv0:trell:v4mv:cbp:last_pred=3:predia=2:dia=2:vmax_b_frames=2:vb_strategy=1:precmp=2:cmp=2:subcmp=2:preme=2:qns=2</option></entry> | |
2831 <entry>6fps</entry> | |
2832 <entry>0dB</entry> | |
2833 </row> | |
2834 <row> | |
2835 <entry>High quality</entry> | |
2836 <entry><option>vcodec=mpeg4:mbd=2:trell:v4mv:last_pred=2:dia=-1:vmax_b_frames=2:vb_strategy=1:cmp=3:subcmp=3:precmp=0:vqcomp=0.6:turbo</option></entry> | |
2837 <entry>15fps</entry> | |
2838 <entry>-0.5dB</entry> | |
2839 </row> | |
2840 <row> | |
2841 <entry>Fast</entry> | |
2842 <entry><option>vcodec=mpeg4:mbd=2:trell:v4mv:turbo</option></entry> | |
2843 <entry>42fps</entry> | |
2844 <entry>-0.74dB</entry> | |
2845 </row> | |
2846 <row> | |
2847 <entry>Realtime</entry> | |
2848 <entry><option>vcodec=mpeg4:mbd=2:turbo</option></entry> | |
2849 <entry>54fps</entry> | |
2850 <entry>-1.21dB</entry> | |
2851 </row> | |
2852 </tbody> | |
2853 </tgroup> | |
2854 </informaltable> | |
2855 </para> | |
2856 </sect2> | |
2857 | |
2858 <sect2 id="custommatrices"><title>Custom inter/intra matrices</title> | |
2859 | |
2860 <para> | |
2861 With this feature of | |
2862 <link linkend="ffmpeg"><systemitem class="library">libavcodec</systemitem></link> | |
2863 you are able to set custom inter (I-frames/keyframes) and intra | |
2864 (P-frames/predicted frames) matrices. It is supported by many of the codecs: | |
2865 <systemitem>mpeg1video</systemitem> and <systemitem>mpeg2video</systemitem> | |
2866 are reported as working. | |
2867 </para> | |
2868 | |
2869 <para> | |
2870 A typical usage of this feature is to set the matrices preferred by the | |
2871 <ulink url="http://www.kvcd.net/">KVCD</ulink> specifications. | |
2872 </para> | |
2873 | |
2874 <para> | |
2875 The <emphasis role="bold">KVCD "Notch" Quantization Matrix:</emphasis> | |
2876 </para> | |
2877 | |
2878 <para> | |
2879 Intra: | |
2880 <screen> | |
2881 8 9 12 22 26 27 29 34 | |
2882 9 10 14 26 27 29 34 37 | |
2883 12 14 18 27 29 34 37 38 | |
2884 22 26 27 31 36 37 38 40 | |
2885 26 27 29 36 39 38 40 48 | |
2886 27 29 34 37 38 40 48 58 | |
2887 29 34 37 38 40 48 58 69 | |
2888 34 37 38 40 48 58 69 79 | |
2889 </screen> | |
2890 | |
2891 Inter: | |
2892 <screen> | |
2893 16 18 20 22 24 26 28 30 | |
2894 18 20 22 24 26 28 30 32 | |
2895 20 22 24 26 28 30 32 34 | |
2896 22 24 26 30 32 32 34 36 | |
2897 24 26 28 32 34 34 36 38 | |
2898 26 28 30 32 34 36 38 40 | |
2899 28 30 32 34 36 38 42 42 | |
2900 30 32 34 36 38 40 42 44 | |
2901 </screen> | |
2902 </para> | |
2903 | |
2904 <para> | |
2905 Usage: | |
2906 <screen> | |
2907 $ mencoder <replaceable>input.avi</replaceable> -o <replaceable>output.avi</replaceable> -oac copy -ovc lavc -lavcopts inter_matrix=...:intra_matrix=... | |
2908 </screen> | |
2909 </para> | |
2910 | |
2911 <para> | |
2912 <screen> | |
2913 $ mencoder <replaceable>input.avi</replaceable> -ovc lavc -lavcopts | |
2914 vcodec=mpeg2video:intra_matrix=8,9,12,22,26,27,29,34,9,10,14,26,27,29,34,37, | |
2915 12,14,18,27,29,34,37,38,22,26,27,31,36,37,38,40,26,27,29,36,39,38,40,48,27, | |
2916 29,34,37,38,40,48,58,29,34,37,38,40,48,58,69,34,37,38,40,48,58,69,79 | |
2917 :inter_matrix=16,18,20,22,24,26,28,30,18,20,22,24,26,28,30,32,20,22,24,26, | |
2918 28,30,32,34,22,24,26,30,32,32,34,36,24,26,28,32,34,34,36,38,26,28,30,32,34, | |
2919 36,38,40,28,30,32,34,36,38,42,42,30,32,34,36,38,40,42,44 -oac copy -o svcd.mpg | |
2920 </screen> | |
2921 </para> | |
2922 </sect2> | |
2923 | |
2924 | |
2925 <sect2 id="menc-feat-dvd-mpeg4-example"> | |
2926 <title>Example</title> | |
2927 | |
2928 <para> | |
2929 So, you have just bought your shiny new copy of Harry Potter and the Chamber | |
2930 of Secrets (widescreen edition, of course), and you want to rip this DVD | |
2931 so that you can add it to your Home Theatre PC. This is a region 1 DVD, | |
2932 so it is NTSC. The example below will still apply to PAL, except you will | |
2933 omit <option>-ofps 24000/1001</option> (because the output framerate is the | |
2934 same as the input framerate), and of course the crop dimensions will be | |
2935 different. | |
2936 </para> | |
2937 | |
2938 <para> | |
2939 After running <option>mplayer dvd://1</option>, we follow the process | |
2940 detailed in the section <link linkend="menc-feat-telecine">How to deal | |
2941 with telecine and interlacing in NTSC DVDs</link> and discover that it is | |
2942 24000/1001 fps progressive video, which means that we need not use an inverse | |
2943 telecine filter, such as <option>pullup</option> or | |
2944 <option>filmdint</option>. | |
2945 </para> | |
2946 | |
2947 <para> | |
2948 Next, we want to determine the appropriate crop rectangle, so we use the | |
2949 cropdetect filter: | |
2950 | |
2951 <screen>mplayer dvd://1 -vf cropdetect</screen> | |
2952 | |
2953 Make sure you seek to a fully filled frame (such as a bright scene), and | |
2954 you will see in <application>MPlayer</application>'s console output: | |
2955 | |
2956 <screen>crop area: X: 0..719 Y: 57..419 (-vf crop=720:362:0:58)</screen> | |
2957 | |
2958 We then play the movie back with this filter to test its correctness: | |
2959 | |
2960 <screen>mplayer dvd://1 -vf crop=720:362:0:58</screen> | |
2961 | |
2962 And we see that it looks perfectly fine. Next, we ensure the width and | |
2963 height are a multiple of 16. The width is fine, however the height is | |
2964 not. Since we did not fail 7th grade math, we know that the nearest | |
2965 multiple of 16 lower than 362 is 352. | |
2966 </para> | |
2967 | |
2968 <para> | |
2969 We could just use <option>crop=720:352:0:58</option>, but it would be nice | |
2970 to take a little off the top and a little off the bottom so that we | |
2971 retain the center. We have shrunk the height by 10 pixels, but we do not | |
2972 want to increase the y-offset by 5-pixels since that is an odd number and | |
2973 will adversely affect quality. Instead, we will increase the y-offset by | |
2974 4 pixels: | |
2975 | |
2976 <screen>mplayer dvd://1 -vf crop=720:352:0:62</screen> | |
2977 | |
2978 Another reason to shave pixels from both the top and the bottom is that we | |
2979 ensure we have eliminated any half-black pixels if they exist. Note that if | |
2980 your video is telecined, make sure the <option>pullup</option> filter (or | |
2981 whichever inverse telecine filter you decide to use) appears in the filter | |
2982 chain before you crop. If it is interlaced, deinterlace before cropping. | |
2983 (If you choose to preserve the interlaced video, then make sure your | |
2984 vertical crop offset is a multiple of 4.) | |
2985 </para> | |
2986 | |
2987 <para> | |
2988 If you are really concerned about losing those 10 pixels, you might | |
2989 prefer instead to scale the dimensions down to the nearest multiple of 16. | |
2990 The filter chain would look like: | |
2991 | |
2992 <screen>-vf crop=720:362:0:58,scale=720:352</screen> | |
2993 | |
2994 Scaling the video down like this will mean that some small amount of | |
2995 detail is lost, though it probably will not be perceptible. Scaling up will | |
2996 result in lower quality (unless you increase the bitrate). Cropping | |
2997 discards those pixels altogether. It is a tradeoff that you will want to | |
2998 consider for each circumstance. For example, if the DVD video was made | |
2999 for television, you might want to avoid vertical scaling, since the line | |
3000 sampling corresponds to the way the content was originally recorded. | |
3001 </para> | |
3002 | |
3003 <para> | |
3004 On inspection, we see that our movie has a fair bit of action and high | |
3005 amounts of detail, so we pick 2400Kbit for our bitrate. | |
3006 </para> | |
3007 | |
3008 <para> | |
3009 We are now ready to do the two pass encode. Pass one: | |
3010 | |
3011 <screen>mencoder dvd://1 -ofps 24000/1001 -oac copy -vf pullup,softskip,crop=720:352:0:62,hqdn3d=2:1:2 -ovc lavc \ | |
3012 -lavcopts vcodec=mpeg4:vbitrate=2400:v4mv:mbd=2:trell:cmp=3:subcmp=3:mbcmp=3:autoaspect:vpass=1 \ | |
3013 -o Harry_Potter_2.avi</screen> | |
3014 | |
3015 And pass two is the same, except that we specify <option>vpass=2</option>: | |
3016 | |
3017 <screen>mencoder dvd://1 -ofps 24000/1001 -oac copy -vf pullup,softskip,crop=720:352:0:62,hqdn3d=2:1:2 -ovc lavc \ | |
3018 -lavcopts vcodec=mpeg4:vbitrate=2400:v4mv:mbd=2:trell:cmp=3:subcmp=3:mbcmp=3:autoaspect:vpass=2 \ | |
3019 -o Harry_Potter_2.avi</screen> | |
3020 </para> | |
3021 | |
3022 <para> | |
3023 The options <option>v4mv:mbd=2:trell</option> will greatly increase the | |
3024 quality at the expense of encoding time. There is little reason to leave | |
3025 these options out when the primary goal is quality. The options | |
3026 <option>cmp=3:subcmp=3:mbcmp=3</option> select a comparison function that | |
3027 yields higher quality than the defaults. You might try experimenting with | |
3028 this parameter (refer to the man page for the possible values) as | |
3029 different functions can have a large impact on quality depending on the | |
3030 source material. For example, if you find | |
3031 <systemitem class="library">libavcodec</systemitem> produces too much | |
3032 blocky artifacting, you could try selecting the experimental NSSE as | |
3033 comparison function via <option>*cmp=10</option>. | |
3034 </para> | |
3035 | |
3036 <para> | |
3037 For this movie, the resulting AVI will be 138 minutes long and nearly | |
3038 3GB. And because you said that file size does not matter, this is a | |
3039 perfectly acceptable size. However, if you had wanted it smaller, you | |
3040 could try a lower bitrate. Increasing bitrates have diminishing | |
3041 returns, so while we might clearly see an improvement from 1800Kbit to | |
3042 2000Kbit, it might not be so noticeable above 2000Kbit. Feel | |
3043 free to experiment until you are happy. | |
3044 </para> | |
3045 | |
3046 <para> | |
3047 Because we passed the source video through a denoise filter, you may want | |
3048 to add some of it back during playback. This, along with the | |
3049 <option>spp</option> post-processing filter, drastically improves the | |
3050 perception of quality and helps eliminate blocky artifacts in the video. | |
3051 With <application>MPlayer</application>'s <option>autoq</option> option, | |
3052 you can vary the amount of post-processing done by the spp filter | |
3053 depending on available CPU. Also, at this point, you may want to apply | |
3054 gamma and/or color correction to best suit your display. For example: | |
3055 | |
3056 <screen>mplayer Harry_Potter_2.avi -vf spp,noise=9ah:5ah,eq2=1.2 -autoq 3</screen> | |
3057 | |
3058 </para> | |
3059 </sect2> | |
3060 </sect1> | |
3061 | |
3062 | |
3063 <sect1 id="menc-feat-xvid"> | |
20879 | 3064 <title>Encoding with the <systemitem class="library">Xvid</systemitem> |
20725 | 3065 codec</title> |
3066 <para> | |
20879 | 3067 <systemitem class="library">Xvid</systemitem> is a free library for |
20725 | 3068 encoding MPEG-4 ASP video streams. |
3069 Before starting to encode, you need to <link linkend="xvid"> | |
3070 set up <application>MEncoder</application> to support it</link>. | |
3071 </para> | |
3072 <para> | |
3073 This guide mainly aims at featuring the same kind of information | |
3074 as x264's encoding guide. | |
3075 Therefore, please begin by reading | |
3076 <link linkend="menc-feat-x264-encoding-options-intro">the first part</link> | |
3077 of that guide. | |
3078 </para> | |
3079 | |
3080 | |
3081 <sect2 id="menc-feat-xvid-intro"> | |
3082 <title>What options should I use to get the best results?</title> | |
3083 | |
3084 <para> | |
3085 Please begin by reviewing the | |
20879 | 3086 <systemitem class="library">Xvid</systemitem> section of |
20725 | 3087 <application>MPlayer</application>'s man page. |
3088 This section is intended to be a supplement to the man page. | |
3089 </para> | |
3090 <para> | |
20879 | 3091 The Xvid default settings are already a good tradeoff between |
20725 | 3092 speed and quality, therefore you can safely stick to them if |
3093 the following section puzzles you. | |
3094 </para> | |
3095 </sect2> | |
3096 | |
3097 <sect2 id="menc-feat-xvid-encoding-options"> | |
20879 | 3098 <title>Encoding options of <systemitem class="library">Xvid</systemitem></title> |
20725 | 3099 |
3100 <itemizedlist> | |
3101 <listitem><para> | |
3102 <emphasis role="bold">vhq</emphasis> | |
3103 This setting affects the macroblock decision algorithm, where the | |
3104 higher the setting, the wiser the decision. | |
3105 The default setting may be safely used for every encode, while | |
3106 higher settings always help PSNR but are significantly slower. | |
3107 Please note that a better PSNR does not necessarily mean | |
3108 that the picture will look better, but tells you that it is | |
3109 closer to the original. | |
3110 Turning it off will noticeably speed up encoding; if speed is | |
3111 critical for you, the tradeoff may be worth it. | |
3112 </para></listitem> | |
3113 | |
3114 <listitem><para> | |
3115 <emphasis role="bold">bvhq</emphasis> | |
3116 This does the same job as vhq, but does it on B-frames. | |
3117 It has a negligible impact on speed, and slightly improves quality | |
3118 (around +0.1dB PSNR). | |
3119 </para></listitem> | |
3120 | |
3121 <listitem><para> | |
3122 <emphasis role="bold">max_bframes</emphasis> | |
3123 A higher number of consecutive allowed B-frames usually improves | |
3124 compressibility, although it may also lead to more blocking artifacts. | |
3125 The default setting is a good tradeoff between compressibility and | |
3126 quality, but you may increase it up to 3 if you are bitrate-starved. | |
3127 You may also decrease it to 1 or 0 if you are aiming at perfect | |
3128 quality, though in that case you should make sure your | |
3129 target bitrate is high enough to ensure that the encoder does not | |
3130 have to increase quantizers to reach it. | |
3131 </para></listitem> | |
3132 | |
3133 <listitem><para> | |
3134 <emphasis role="bold">bf_threshold</emphasis> | |
3135 This controls the B-frame sensitivity of the encoder, where a higher | |
3136 value leads to more B-frames being used (and vice versa). | |
3137 This setting is to be used together with <option>max_bframes</option>; | |
3138 if you are bitrate-starved, you should increase both | |
3139 <option>max_bframes</option> and <option>bf_threshold</option>, | |
3140 while you may increase <option>max_bframes</option> and reduce | |
3141 <option>bf_threshold</option> so that the encoder may use more | |
3142 B-frames in places that only <emphasis role="bold">really</emphasis> | |
3143 need them. | |
3144 A low number of <option>max_bframes</option> and a high value of | |
3145 <option>bf_threshold</option> is probably not a wise choice as it | |
3146 will force the encoder to put B-frames in places that would not | |
3147 benefit from them, therefore reducing visual quality. | |
3148 However, if you need to be compatible with standalone players that | |
3149 only support old DivX profiles (which only supports up to 1 | |
3150 consecutive B-frame), this would be your only way to | |
3151 increase compressibility through using B-frames. | |
3152 </para></listitem> | |
3153 | |
3154 <listitem><para> | |
3155 <emphasis role="bold">trellis</emphasis> | |
3156 Optimizes the quantization process to get an optimal tradeoff | |
3157 between PSNR and bitrate, which allows significant bit saving. | |
3158 These bits will in return be spent elsewhere on the video, | |
3159 raising overall visual quality. | |
3160 You should always leave it on as its impact on quality is huge. | |
3161 Even if you are looking for speed, do not disable it until you | |
3162 have turned down <option>vhq</option> and all other more | |
3163 CPU-hungry options to the minimum. | |
3164 </para></listitem> | |
3165 | |
3166 <listitem><para> | |
3167 <emphasis role="bold">hq_ac</emphasis> | |
3168 Activates a better coefficient cost estimation method, which slightly | |
3169 reduces filesize by around 0.15 to 0.19% (which corresponds to less | |
3170 than 0.01dB PSNR increase), while having a negligible impact on speed. | |
3171 It is therefore recommended to always leave it on. | |
3172 </para></listitem> | |
3173 | |
3174 <listitem><para> | |
3175 <emphasis role="bold">cartoon</emphasis> | |
3176 Designed to better encode cartoon content, and has no impact on | |
3177 speed as it just tunes the mode decision heuristics for this type | |
3178 of content. | |
3179 </para></listitem> | |
3180 | |
3181 <listitem><para> | |
3182 <emphasis role="bold">me_quality</emphasis> | |
3183 This setting is to control the precision of the motion estimation. | |
3184 The higher <option>me_quality</option>, the more | |
3185 precise the estimation of the original motion will be, and the | |
3186 better the resulting clip will capture the original motion. | |
3187 </para> | |
3188 <para> | |
3189 The default setting is best in all cases; | |
3190 thus it is not recommended to turn it down unless you are | |
3191 really looking for speed, as all the bits saved by a good motion | |
3192 estimation would be spent elsewhere, raising overall quality. | |
3193 Therefore, do not go any lower than 5, and even that only as a last | |
3194 resort. | |
3195 </para></listitem> | |
3196 | |
3197 <listitem><para> | |
3198 <emphasis role="bold">chroma_me</emphasis> | |
3199 Improves motion estimation by also taking the chroma (color) | |
3200 information into account, whereas <option>me_quality</option> | |
3201 alone only uses luma (grayscale). | |
3202 This slows down encoding by 5-10% but improves visual quality | |
3203 quite a bit by reducing blocking effects and reduces filesize by | |
3204 around 1.3%. | |
3205 If you are looking for speed, you should disable this option before | |
3206 starting to consider reducing <option>me_quality</option>. | |
3207 </para></listitem> | |
3208 | |
3209 <listitem><para> | |
3210 <emphasis role="bold">chroma_opt</emphasis> | |
3211 Is intended to increase chroma image quality around pure | |
3212 white/black edges, rather than improving compression. | |
3213 This can help to reduce the "red stairs" effect. | |
3214 </para></listitem> | |
3215 | |
3216 <listitem><para> | |
3217 <emphasis role="bold">lumi_mask</emphasis> | |
3218 Tries to give less bitrate to part of the picture that the | |
3219 human eye cannot see very well, which should allow the encoder | |
3220 to spend the saved bits on more important parts of the picture. | |
3221 The quality of the encode yielded by this option highly depends | |
3222 on personal preferences and on the type and monitor settings | |
3223 used to watch it (typically, it will not look as good if it is | |
3224 bright or if it is a TFT monitor). | |
3225 </para></listitem> | |
3226 | |
3227 <listitem><para> | |
3228 <emphasis role="bold">qpel</emphasis> | |
3229 Raise the number of candidate motion vectors by increasing | |
3230 the precision of the motion estimation from halfpel to | |
3231 quarterpel. | |
3232 The idea is to find better motion vectors which will in return | |
3233 reduce bitrate (hence increasing quality). | |
3234 However, motion vectors with quarterpel precision require a | |
3235 few extra bits to code, but the candidate vectors do not always | |
3236 give (much) better results. | |
3237 Quite often, the codec still spends bits on the extra precision, | |
3238 but little or no extra quality is gained in return. | |
3239 Unfortunately, there is no way to foresee the possible gains of | |
3240 <option>qpel</option>, so you need to actually encode with and | |
3241 without it to know for sure. | |
3242 </para><para> | |
3243 <option>qpel</option> can be almost double encoding time, and | |
3244 requires as much as 25% more processing power to decode. | |
3245 It is not supported by all standalone players. | |
3246 </para></listitem> | |
3247 | |
3248 <listitem><para> | |
3249 <emphasis role="bold">gmc</emphasis> | |
3250 Tries to save bits on panning scenes by using a single motion | |
3251 vector for the whole frame. | |
3252 This almost always raises PSNR, but significantly slows down | |
3253 encoding (as well as decoding). | |
3254 Therefore, you should only use it when you have turned | |
3255 <option>vhq</option> to the maximum. | |
20879 | 3256 <systemitem class="library">Xvid</systemitem>'s GMC is more |
20725 | 3257 sophisticated than DivX's, but is only supported by few |
3258 standalone players. | |
3259 </para></listitem> | |
3260 | |
3261 </itemizedlist> | |
3262 </sect2> | |
3263 | |
3264 <sect2 id="menc-feat-xvid-encoding-profiles"> | |
3265 <title>Encoding profiles</title> | |
3266 <para> | |
20879 | 3267 Xvid supports encoding profiles through the <option>profile</option> option, |
3268 which are used to impose restrictions on the properties of the Xvid video | |
20725 | 3269 stream such that it will be playable on anything which supports the |
3270 chosen profile. | |
3271 The restrictions relate to resolutions, bitrates and certain MPEG-4 | |
3272 features. | |
3273 The following table shows what each profile supports. | |
3274 </para> | |
3275 <informaltable> | |
3276 <tgroup cols="16" align="center"> | |
3277 <colspec colnum="1" colname="col1"/> | |
3278 <colspec colnum="2" colname="col2"/> | |
3279 <colspec colnum="3" colname="col3"/> | |
3280 <colspec colnum="4" colname="col4"/> | |
3281 <colspec colnum="5" colname="col5"/> | |
3282 <colspec colnum="6" colname="col6"/> | |
3283 <colspec colnum="7" colname="col7"/> | |
3284 <colspec colnum="8" colname="col8"/> | |
3285 <colspec colnum="9" colname="col9"/> | |
3286 <colspec colnum="10" colname="col10"/> | |
3287 <colspec colnum="11" colname="col11"/> | |
3288 <colspec colnum="12" colname="col12"/> | |
3289 <colspec colnum="13" colname="col13"/> | |
3290 <colspec colnum="14" colname="col14"/> | |
3291 <colspec colnum="15" colname="col15"/> | |
3292 <colspec colnum="16" colname="col16"/> | |
3293 <colspec colnum="17" colname="col17"/> | |
3294 <spanspec spanname="spa2-5" namest="col2" nameend="col5"/> | |
3295 <spanspec spanname="spa6-11" namest="col6" nameend="col11"/> | |
3296 <spanspec spanname="spa12-17" namest="col12" nameend="col17"/> | |
3297 <tbody> | |
3298 <row> | |
3299 <entry></entry> | |
3300 <entry spanname="spa2-5">Simple</entry> | |
3301 <entry spanname="spa6-11">Advanced Simple</entry> | |
3302 <entry spanname="spa12-17">DivX</entry> | |
3303 </row> | |
3304 <row> | |
3305 <entry>Profile name</entry> | |
3306 <entry>0</entry> | |
3307 <entry>1</entry> | |
3308 <entry>2</entry> | |
3309 <entry>3</entry> | |
3310 <entry>0</entry> | |
3311 <entry>1</entry> | |
3312 <entry>2</entry> | |
3313 <entry>3</entry> | |
3314 <entry>4</entry> | |
3315 <entry>5</entry> | |
3316 <entry>Handheld</entry> | |
3317 <entry>Portable NTSC</entry> | |
3318 <entry>Portable PAL</entry> | |
3319 <entry>Home Theater NTSC</entry> | |
3320 <entry>Home Theater PAL</entry> | |
3321 <entry>HDTV</entry> | |
3322 </row> | |
3323 <row> | |
3324 <entry>Width [pixels]</entry> | |
3325 <entry>176</entry> | |
3326 <entry>176</entry> | |
3327 <entry>352</entry> | |
3328 <entry>352</entry> | |
3329 <entry>176</entry> | |
3330 <entry>176</entry> | |
3331 <entry>352</entry> | |
3332 <entry>352</entry> | |
3333 <entry>352</entry> | |
3334 <entry>720</entry> | |
3335 <entry>176</entry> | |
3336 <entry>352</entry> | |
3337 <entry>352</entry> | |
3338 <entry>720</entry> | |
3339 <entry>720</entry> | |
3340 <entry>1280</entry> | |
3341 </row> | |
3342 <row> | |
3343 <entry>Height [pixels]</entry> | |
3344 <entry>144</entry> | |
3345 <entry>144</entry> | |
3346 <entry>288</entry> | |
3347 <entry>288</entry> | |
3348 <entry>144</entry> | |
3349 <entry>144</entry> | |
3350 <entry>288</entry> | |
3351 <entry>288</entry> | |
3352 <entry>576</entry> | |
3353 <entry>576</entry> | |
3354 <entry>144</entry> | |
3355 <entry>240</entry> | |
3356 <entry>288</entry> | |
3357 <entry>480</entry> | |
3358 <entry>576</entry> | |
3359 <entry>720</entry> | |
3360 </row> | |
3361 <row> | |
3362 <entry>Frame rate [fps]</entry> | |
3363 <entry>15</entry> | |
3364 <entry>15</entry> | |
3365 <entry>15</entry> | |
3366 <entry>15</entry> | |
3367 <entry>30</entry> | |
3368 <entry>30</entry> | |
3369 <entry>15</entry> | |
3370 <entry>30</entry> | |
3371 <entry>30</entry> | |
3372 <entry>30</entry> | |
3373 <entry>15</entry> | |
3374 <entry>30</entry> | |
3375 <entry>25</entry> | |
3376 <entry>30</entry> | |
3377 <entry>25</entry> | |
3378 <entry>30</entry> | |
3379 </row> | |
3380 <row> | |
3381 <entry>Max average bitrate [kbps]</entry> | |
3382 <entry>64</entry> | |
3383 <entry>64</entry> | |
3384 <entry>128</entry> | |
3385 <entry>384</entry> | |
3386 <entry>128</entry> | |
3387 <entry>128</entry> | |
3388 <entry>384</entry> | |
3389 <entry>768</entry> | |
3390 <entry>3000</entry> | |
3391 <entry>8000</entry> | |
3392 <entry>537.6</entry> | |
3393 <entry>4854</entry> | |
3394 <entry>4854</entry> | |
3395 <entry>4854</entry> | |
3396 <entry>4854</entry> | |
3397 <entry>9708.4</entry> | |
3398 </row> | |
3399 <row> | |
3400 <entry>Peak average bitrate over 3 secs [kbps]</entry> | |
3401 <entry></entry> | |
3402 <entry></entry> | |
3403 <entry></entry> | |
3404 <entry></entry> | |
3405 <entry></entry> | |
3406 <entry></entry> | |
3407 <entry></entry> | |
3408 <entry></entry> | |
3409 <entry></entry> | |
3410 <entry></entry> | |
3411 <entry>800</entry> | |
3412 <entry>8000</entry> | |
3413 <entry>8000</entry> | |
3414 <entry>8000</entry> | |
3415 <entry>8000</entry> | |
3416 <entry>16000</entry> | |
3417 </row> | |
3418 <row> | |
3419 <entry>Max. B-frames</entry> | |
3420 <entry>0</entry> | |
3421 <entry>0</entry> | |
3422 <entry>0</entry> | |
3423 <entry>0</entry> | |
3424 <entry></entry> | |
3425 <entry></entry> | |
3426 <entry></entry> | |
3427 <entry></entry> | |
3428 <entry></entry> | |
3429 <entry></entry> | |
3430 <entry>0</entry> | |
3431 <entry>1</entry> | |
3432 <entry>1</entry> | |
3433 <entry>1</entry> | |
3434 <entry>1</entry> | |
3435 <entry>2</entry> | |
3436 </row> | |
3437 <row> | |
3438 <entry>MPEG quantization</entry> | |
3439 <entry></entry> | |
3440 <entry></entry> | |
3441 <entry></entry> | |
3442 <entry></entry> | |
3443 <entry>X</entry> | |
3444 <entry>X</entry> | |
3445 <entry>X</entry> | |
3446 <entry>X</entry> | |
3447 <entry>X</entry> | |
3448 <entry>X</entry> | |
3449 <entry></entry> | |
3450 <entry></entry> | |
3451 <entry></entry> | |
3452 <entry></entry> | |
3453 <entry></entry> | |
3454 <entry></entry> | |
3455 </row> | |
3456 <row> | |
3457 <entry>Adaptive quantization</entry> | |
3458 <entry></entry> | |
3459 <entry></entry> | |
3460 <entry></entry> | |
3461 <entry></entry> | |
3462 <entry>X</entry> | |
3463 <entry>X</entry> | |
3464 <entry>X</entry> | |
3465 <entry>X</entry> | |
3466 <entry>X</entry> | |
3467 <entry>X</entry> | |
3468 <entry>X</entry> | |
3469 <entry>X</entry> | |
3470 <entry>X</entry> | |
3471 <entry>X</entry> | |
3472 <entry>X</entry> | |
3473 <entry>X</entry> | |
3474 </row> | |
3475 <row> | |
3476 <entry>Interlaced encoding</entry> | |
3477 <entry></entry> | |
3478 <entry></entry> | |
3479 <entry></entry> | |
3480 <entry></entry> | |
3481 <entry>X</entry> | |
3482 <entry>X</entry> | |
3483 <entry>X</entry> | |
3484 <entry>X</entry> | |
3485 <entry>X</entry> | |
3486 <entry>X</entry> | |
3487 <entry></entry> | |
3488 <entry></entry> | |
3489 <entry></entry> | |
3490 <entry>X</entry> | |
3491 <entry>X</entry> | |
3492 <entry>X</entry> | |
3493 </row> | |
3494 <row> | |
3495 <entry>Quaterpixel</entry> | |
3496 <entry></entry> | |
3497 <entry></entry> | |
3498 <entry></entry> | |
3499 <entry></entry> | |
3500 <entry>X</entry> | |
3501 <entry>X</entry> | |
3502 <entry>X</entry> | |
3503 <entry>X</entry> | |
3504 <entry>X</entry> | |
3505 <entry>X</entry> | |
3506 <entry></entry> | |
3507 <entry></entry> | |
3508 <entry></entry> | |
3509 <entry></entry> | |
3510 <entry></entry> | |
3511 <entry></entry> | |
3512 </row> | |
3513 <row> | |
3514 <entry>Global motion compensation</entry> | |
3515 <entry></entry> | |
3516 <entry></entry> | |
3517 <entry></entry> | |
3518 <entry></entry> | |
3519 <entry>X</entry> | |
3520 <entry>X</entry> | |
3521 <entry>X</entry> | |
3522 <entry>X</entry> | |
3523 <entry>X</entry> | |
3524 <entry>X</entry> | |
3525 <entry></entry> | |
3526 <entry></entry> | |
3527 <entry></entry> | |
3528 <entry></entry> | |
3529 <entry></entry> | |
3530 <entry></entry> | |
3531 </row> | |
3532 </tbody> | |
3533 </tgroup> | |
3534 </informaltable> | |
3535 </sect2> | |
3536 | |
3537 <sect2 id="menc-feat-xvid-example-settings"> | |
3538 <title>Encoding setting examples</title> | |
3539 | |
3540 <para> | |
3541 The following settings are examples of different encoding | |
3542 option combinations that affect the speed vs quality tradeoff | |
3543 at the same target bitrate. | |
3544 </para> | |
3545 | |
3546 <para> | |
3547 All the encoding settings were tested on a 720x448 @30000/1001 fps | |
3548 video sample, the target bitrate was 900kbps, and the machine was an | |
3549 AMD-64 3400+ at 2400 MHz in 64 bits mode. | |
3550 Each encoding setting features the measured encoding speed (in | |
3551 frames per second) and the PSNR loss (in dB) compared to the "very | |
3552 high quality" setting. | |
3553 Please understand that depending on your source, your machine type | |
3554 and development advancements, you may get very different results. | |
3555 </para> | |
3556 | |
3557 <para> | |
3558 <informaltable frame="all"> | |
3559 <tgroup cols="4"> | |
3560 <thead> | |
3561 <row><entry>Description</entry><entry>Encoding options</entry><entry>speed (in fps)</entry><entry>Relative PSNR loss (in dB)</entry></row> | |
3562 </thead> | |
3563 <tbody> | |
3564 <row> | |
3565 <entry>Very high quality</entry> | |
3566 <entry><option>chroma_opt:vhq=4:bvhq=1:quant_type=mpeg</option></entry> | |
3567 <entry>16fps</entry> | |
3568 <entry>0dB</entry> | |
3569 </row> | |
3570 <row> | |
3571 <entry>High quality</entry> | |
3572 <entry><option>vhq=2:bvhq=1:chroma_opt:quant_type=mpeg</option></entry> | |
3573 <entry>18fps</entry> | |
3574 <entry>-0.1dB</entry> | |
3575 </row> | |
3576 <row> | |
3577 <entry>Fast</entry> | |
3578 <entry><option>turbo:vhq=0</option></entry> | |
3579 <entry>28fps</entry> | |
3580 <entry>-0.69dB</entry> | |
3581 </row> | |
3582 <row> | |
3583 <entry>Realtime</entry> | |
3584 <entry><option>turbo:nochroma_me:notrellis:max_bframes=0:vhq=0</option></entry> | |
3585 <entry>38fps</entry> | |
3586 <entry>-1.48dB</entry> | |
3587 </row> | |
3588 </tbody> | |
3589 </tgroup> | |
3590 </informaltable> | |
3591 </para> | |
3592 </sect2> | |
3593 | |
3594 </sect1> | |
3595 | |
3596 <sect1 id="menc-feat-x264"> | |
3597 <title>Encoding with the <systemitem class="library">x264</systemitem> codec</title> | |
3598 <para> | |
3599 <systemitem class="library">x264</systemitem> is a free library for | |
3600 encoding H.264/AVC video streams. | |
3601 Before starting to encode, you need to <link linkend="codec-x264-encode"> | |
3602 set up <application>MEncoder</application> to support it</link>. | |
3603 </para> | |
3604 | |
3605 <sect2 id="menc-feat-x264-encoding-options"> | |
3606 <title>Encoding options of x264</title> | |
3607 | |
3608 <para> | |
3609 Please begin by reviewing the | |
3610 <systemitem class="library">x264</systemitem> section of | |
3611 <application>MPlayer</application>'s man page. | |
3612 This section is intended to be a supplement to the man page. | |
3613 Here you will find quick hints about which options are most | |
3614 likely to interest most people. The man page is more terse, | |
3615 but also more exhaustive, and it sometimes offers much better | |
3616 technical detail. | |
3617 </para> | |
3618 | |
3619 <sect3 id="menc-feat-x264-encoding-options-intro"> | |
3620 <title>Introduction</title> | |
3621 <para>This guide considers two major categories of encoding options:</para> | |
3622 | |
3623 <orderedlist> | |
3624 <listitem><para>Options which mainly trade off encoding time vs. quality | |
3625 </para></listitem> | |
3626 <listitem><para>Options which may be useful for fulfilling various personal | |
3627 preferences and special requirements</para></listitem> | |
3628 </orderedlist> | |
3629 | |
3630 <para> | |
3631 Ultimately, only you can decide which options are best for your | |
3632 purposes. The decision for the first class of options is the simplest: | |
3633 you only have to decide whether you think the quality differences | |
3634 justify the speed differences. For the second class of options, | |
3635 preferences may be far more subjective, and more factors may be | |
3636 involved. Note that some of the "personal preferences and special | |
3637 requirements" options can still have large impacts on speed or quality, | |
3638 but that is not what they are primarily useful for. A couple of the | |
3639 "personal preference" options may even cause changes that look better | |
3640 to some people, but look worse to others. | |
3641 </para> | |
3642 | |
3643 <para> | |
3644 Before continuing, you need to understand that this guide uses only one | |
3645 quality metric: global PSNR. | |
3646 For a brief explanation of what PSNR is, see | |
3647 <ulink url="http://en.wikipedia.org/wiki/PSNR">the Wikipedia article on PSNR</ulink>. | |
3648 Global PSNR is the last PSNR number reported when you include | |
3649 the <option>psnr</option> option in <option>x264encopts</option>. | |
3650 Any time you read a claim about PSNR, one of the assumptions | |
3651 behind the claim is that equal bitrates are used. | |
3652 </para> | |
3653 | |
3654 <para> | |
3655 Nearly all of this guide's comments assume you are using | |
3656 two pass. | |
3657 When comparing options, there are two major reasons for using | |
3658 two pass encoding. | |
3659 First, using two pass often gains around 1dB PSNR, which is a | |
3660 very big difference. | |
3661 Secondly, testing options by doing direct quality comparisons | |
3662 with one pass encodes introduces a major confounding | |
3663 factor: bitrate often varies significantly with each encode. | |
3664 It is not always easy to tell whether quality changes are due | |
3665 mainly to changed options, or if they mostly reflect essentially | |
3666 random differences in the achieved bitrate. | |
3667 </para> | |
3668 | |
3669 </sect3> | |
3670 | |
3671 <sect3 id="menc-feat-x264-encoding-options-speedvquality"> | |
3672 <title>Options which primarily affect speed and quality</title> | |
3673 | |
3674 <itemizedlist> | |
3675 <listitem><para> | |
3676 <emphasis role="bold">subq</emphasis>: | |
3677 Of the options which allow you to trade off speed for quality, | |
3678 <option>subq</option> and <option>frameref</option> (see below) are usually | |
3679 by far the most important. | |
3680 If you are interested in tweaking either speed or quality, these | |
3681 are the first options you should consider. | |
3682 On the speed dimension, the <option>frameref</option> and | |
3683 <option>subq</option> options interact with each other fairly | |
3684 strongly. | |
3685 Experience shows that, with one reference frame, | |
3686 <option>subq=5</option> (the default setting) takes about 35% more time than | |
3687 <option>subq=1</option>. | |
3688 With 6 reference frames, the penalty grows to over 60%. | |
3689 <option>subq</option>'s effect on PSNR seems fairly constant | |
3690 regardless of the number of reference frames. | |
3691 Typically, <option>subq=5</option> achieves 0.2-0.5 dB higher global | |
3692 PSNR in comparison <option>subq=1</option>. | |
3693 This is usually enough to be visible. | |
3694 </para> | |
3695 <para> | |
3696 <option>subq=6</option> is the slowest, highest quality mode. | |
3697 In comparison to <option>subq=5</option>, it usually gains 0.1-0.4 dB | |
3698 global PSNR with speed costs varying from 25%-100%. | |
3699 Unlike other levels of <option>subq</option>, the behavior of | |
3700 <option>subq=6</option> does not depend much on <option>frameref</option> | |
3701 and <option>me</option>. Instead, the effectiveness of <option>subq=6 | |
3702 </option> depends mostly upon the number of B-frames used. In normal | |
3703 usage, this means <option>subq=6</option> has a large impact on both speed | |
3704 and quality in complex, high motion scenes, but it may not have much effect | |
3705 in low-motion scenes. Note that it is still recommended to always set | |
3706 <option>bframes</option> to something other than zero (see below). | |
3707 </para></listitem> | |
3708 <listitem><para> | |
3709 <emphasis role="bold">frameref</emphasis>: | |
3710 <option>frameref</option> is set to 1 by default, but this | |
3711 should not be taken to imply that it is reasonable to set it | |
3712 to 1. | |
3713 Merely raising <option>frameref</option> to 2 gains around | |
3714 0.15dB PSNR with a 5-10% speed penalty; this seems like a | |
3715 good tradeoff. | |
3716 <option>frameref=3</option> gains around 0.25dB PSNR over | |
3717 <option>frameref=1</option>, which should be a visible | |
3718 difference. | |
3719 <option>frameref=3</option> is around 15% slower than | |
3720 <option>frameref=1</option>. | |
3721 Unfortunately, diminishing returns set in rapidly. | |
3722 <option>frameref=6</option> can be expected to gain only | |
3723 0.05-0.1 dB over <option>frameref=3</option> at an additional | |
3724 15% speed penalty. | |
3725 Above <option>frameref=6</option>, the quality gains are | |
3726 usually very small (although you should keep in mind throughout | |
3727 this whole discussion that it can vary quite a lot depending on | |
3728 your source). | |
3729 In a fairly typical case, <option>frameref=12</option> | |
3730 will improve global PSNR by a tiny 0.02dB over | |
3731 <option>frameref=6</option>, at a speed cost of 15%-20%. | |
3732 At such high <option>frameref</option> values, the only really | |
3733 good thing that can be said is that increasing it even further will | |
3734 almost certainly never <emphasis role="bold">harm</emphasis> | |
3735 PSNR, but the additional quality benefits are barely even | |
3736 measurable, let alone perceptible. | |
3737 </para> | |
3738 <note><title>Note:</title> | |
3739 <para> | |
3740 Raising <option>frameref</option> to unnecessarily high values | |
3741 <emphasis role="bold">can</emphasis> and | |
3742 <emphasis role="bold">usually does</emphasis> | |
3743 hurt coding efficiency if you turn CABAC off. | |
3744 With CABAC on (the default behavior), the possibility of setting | |
3745 <option>frameref</option> "too high" currently seems too remote | |
3746 to even worry about, and in the future, optimizations may remove | |
3747 the possibility altogether. | |
3748 </para> | |
3749 </note> | |
3750 <para> | |
3751 If you care about speed, a reasonable compromise is to use low | |
3752 <option>subq</option> and <option>frameref</option> values on | |
3753 the first pass, and then raise them on the second pass. | |
3754 Typically, this has a negligible negative effect on the final | |
3755 quality: You will probably lose well under 0.1dB PSNR, which | |
3756 should be much too small of a difference to see. | |
3757 However, different values of <option>frameref</option> can | |
3758 occasionally affect frametype decision. | |
3759 Most likely, these are rare outlying cases, but if you want to | |
3760 be pretty sure, consider whether your video has either | |
3761 fullscreen repetitive flashing patterns or very large temporary | |
3762 occlusions which might force an I-frame. | |
3763 Adjust the first-pass <option>frameref</option> so it is large | |
3764 enough to contain the duration of the flashing cycle (or occlusion). | |
3765 For example, if the scene flashes back and forth between two images | |
3766 over a duration of three frames, set the first pass | |
3767 <option>frameref</option> to 3 or higher. | |
3768 This issue is probably extremely rare in live action video material, | |
3769 but it does sometimes come up in video game captures. | |
3770 </para></listitem> | |
3771 | |
3772 <listitem><para> | |
3773 <emphasis role="bold">me</emphasis>: | |
3774 This option is for choosing the motion estimation search method. | |
3775 Altering this option provides a straightforward quality-vs-speed | |
3776 tradeoff. <option>me=dia</option> is only a few percent faster than | |
3777 the default search, at a cost of under 0.1dB global PSNR. The | |
3778 default setting (<option>me=hex</option>) is a reasonable tradeoff | |
3779 between speed and quality. <option>me=umh</option> gains a little under | |
3780 0.1dB global PSNR, with a speed penalty that varies depending on | |
3781 <option>frameref</option>. At high values of | |
3782 <option>frameref</option> (e.g. 12 or so), <option>me=umh</option> | |
3783 is about 40% slower than the default <option> me=hex</option>. With | |
3784 <option>frameref=3</option>, the speed penalty incurred drops to | |
3785 25%-30%. | |
3786 </para> | |
3787 <para> | |
3788 <option>me=esa</option> uses an exhaustive search that is too slow for | |
3789 practical use. | |
3790 </para> | |
3791 </listitem> | |
3792 | |
3793 <listitem><para> | |
3794 <emphasis role="bold">partitions=all</emphasis>: | |
3795 This option enables the use of 8x4, 4x8 and 4x4 subpartitions in | |
3796 predicted macroblocks (in addition to the default partitions). | |
3797 Enabling it results in a fairly consistent | |
3798 10%-15% loss of speed. This option is rather useless in source | |
3799 containing only low motion, however in some high-motion source, | |
3800 particularly source with lots of small moving objects, gains of | |
3801 about 0.1dB can be expected. | |
3802 </para> | |
3803 </listitem> | |
3804 | |
3805 <listitem><para> | |
3806 <emphasis role="bold">bframes</emphasis>: | |
3807 If you are used to encoding with other codecs, you may have found | |
3808 that B-frames are not always useful. | |
3809 In H.264, this has changed: there are new techniques and block | |
3810 types that are possible in B-frames. | |
3811 Usually, even a naive B-frame choice algorithm can have a | |
3812 significant PSNR benefit. | |
3813 It is interesting to note that using B-frames usually speeds up | |
3814 the second pass somewhat, and may also speed up a single | |
3815 pass encode if adaptive B-frame decision is turned off. | |
3816 </para> | |
3817 <para> | |
3818 With adaptive B-frame decision turned off | |
3819 (<option>x264encopts</option>'s <option>nob_adapt</option>), | |
3820 the optimal value for this setting is usually no more than | |
3821 <option>bframes=1</option>, or else high-motion scenes can suffer. | |
3822 With adaptive B-frame decision on (the default behavior), it is | |
3823 safe to use higher values; the encoder will reduce the use of | |
3824 B-frames in scenes where they would hurt compression. | |
3825 The encoder rarely chooses to use more than 3 or 4 B-frames; | |
3826 setting this option any higher will have little effect. | |
3827 </para></listitem> | |
3828 | |
3829 <listitem><para> | |
3830 <emphasis role="bold">b_adapt</emphasis>: | |
3831 Note: This is on by default. | |
3832 </para> | |
3833 <para> | |
3834 With this option enabled, the encoder will use a reasonably fast | |
3835 decision process to reduce the number of B-frames used in scenes that | |
3836 might not benefit from them as much. | |
3837 You can use <option>b_bias</option> to tweak how B-frame-happy | |
3838 the encoder is. | |
3839 The speed penalty of adaptive B-frames is currently rather modest, | |
3840 but so is the potential quality gain. | |
3841 It usually does not hurt, however. | |
3842 Note that this only affects speed and frametype decision on the | |
3843 first pass. | |
3844 <option>b_adapt</option> and <option>b_bias</option> have no | |
3845 effect on subsequent passes. | |
3846 </para></listitem> | |
3847 | |
3848 <listitem><para> | |
3849 <emphasis role="bold">b_pyramid</emphasis>: | |
3850 You might as well enable this option if you are using >=2 B-frames; | |
3851 as the man page says, you get a little quality improvement at no | |
3852 speed cost. | |
3853 Note that these videos cannot be read by libavcodec-based decoders | |
3854 older than about March 5, 2005. | |
3855 </para></listitem> | |
3856 | |
3857 <listitem><para> | |
3858 <emphasis role="bold">weight_b</emphasis>: | |
3859 In typical cases, there is not much gain with this option. | |
3860 However, in crossfades or fade-to-black scenes, weighted | |
3861 prediction gives rather large bitrate savings. | |
3862 In MPEG-4 ASP, a fade-to-black is usually best coded as a series | |
3863 of expensive I-frames; using weighted prediction in B-frames | |
3864 makes it possible to turn at least some of these into much smaller | |
3865 B-frames. | |
3866 Encoding time cost is minimal, as no extra decisions need to be made. | |
3867 Also, contrary to what some people seem to guess, the decoder | |
3868 CPU requirements are not much affected by weighted prediction, | |
3869 all else being equal. | |
3870 </para> | |
3871 <para> | |
3872 Unfortunately, the current adaptive B-frame decision algorithm | |
3873 has a strong tendency to avoid B-frames during fades. | |
3874 Until this changes, it may be a good idea to add | |
3875 <option>nob_adapt</option> to your x264encopts, if you expect | |
3876 fades to have a large effect in your particular video | |
3877 clip. | |
3878 </para></listitem> | |
3879 </itemizedlist> | |
3880 </sect3> | |
3881 | |
3882 <sect3 id="menc-feat-x264-encoding-options-misc-preferences"> | |
3883 <title>Options pertaining to miscellaneous preferences</title> | |
3884 <itemizedlist> | |
3885 <listitem><para> | |
3886 <emphasis role="bold">Two pass encoding</emphasis>: | |
3887 Above, it was suggested to always use two pass encoding, but there | |
3888 are still reasons for not using it. For instance, if you are capturing | |
3889 live TV and encoding in realtime, you are forced to use single-pass. | |
3890 Also, one pass is obviously faster than two passes; if you use the | |
3891 exact same set of options on both passes, two pass encoding is almost | |
3892 twice as slow. | |
3893 </para> | |
3894 <para> | |
3895 Still, there are very good reasons for using two pass encoding. For | |
3896 one thing, single pass ratecontrol is not psychic, and it often makes | |
3897 unreasonable choices because it cannot see the big picture. For example, | |
3898 suppose you have a two minute long video consisting of two distinct | |
3899 halves. The first half is a very high-motion scene lasting 60 seconds | |
3900 which, in isolation, requires about 2500kbps in order to look decent. | |
3901 Immediately following it is a much less demanding 60-second scene | |
3902 that looks good at 300kbps. Suppose you ask for 1400kbps on the theory | |
3903 that this is enough to accomodate both scenes. Single pass ratecontrol | |
3904 will make a couple of "mistakes" in such a case. First of all, it | |
3905 will target 1400kbps in both segments. The first segment may end up | |
3906 heavily overquantized, causing it to look unacceptably and unreasonably | |
3907 blocky. The second segment will be heavily underquantized; it may look | |
3908 perfect, but the bitrate cost of that perfection will be completely | |
3909 unreasonable. What is even harder to avoid is the problem at the | |
3910 transition between the two scenes. The first seconds of the low motion | |
3911 half will be hugely over-quantized, because the ratecontrol is still | |
3912 expecting the kind of bitrate requirements it met in the first half | |
3913 of the video. This "error period" of heavily over-quantized low motion | |
3914 will look jarringly bad, and will actually use less than the 300kbps | |
3915 it would have taken to make it look decent. There are ways to | |
3916 mitigate the pitfalls of single-pass encoding, but they may tend to | |
3917 increase bitrate misprediction. | |
3918 </para> | |
3919 <para> | |
3920 Multipass ratecontrol can offer huge advantages over a single pass. | |
3921 Using the statistics gathered from the first pass encode, the encoder | |
3922 can estimate, with reasonable accuracy, the "cost" (in bits) of | |
3923 encoding any given frame, at any given quantizer. This allows for | |
3924 a much more rational, better planned allocation of bits between the | |
3925 expensive (high-motion) and cheap (low-motion) scenes. See | |
3926 <option>qcomp</option> below for some ideas on how to tweak this | |
3927 allocation to your liking. | |
3928 </para> | |
3929 <para> | |
3930 Moreover, two passes need not take twice as long as one pass. You can | |
3931 tweak the options in the first pass for higher speed and lower quality. | |
3932 If you choose your options well, you can get a very fast first pass. | |
3933 The resulting quality in the second pass will be slightly lower because size | |
3934 prediction is less accurate, but the quality difference is normally much | |
3935 too small to be visible. Try, for example, adding | |
3936 <option>subq=1:frameref=1</option> to the first pass | |
3937 <option>x264encopts</option>. Then, on the second pass, use slower, | |
3938 higher-quality options: | |
3939 <option>subq=6:frameref=15:partitions=all:me=umh</option> | |
3940 </para></listitem> | |
3941 <listitem><para> | |
3942 <emphasis role="bold">Three pass encoding</emphasis>? | |
3943 | |
3944 x264 offers the ability to make an arbitrary number of consecutive | |
3945 passes. If you specify <option>pass=1</option> on the first pass, | |
3946 then use <option>pass=3</option> on a subsequent pass, the subsequent | |
3947 pass will both read the statistics from the previous pass, and write | |
3948 its own statistics. An additional pass following this one will have | |
3949 a very good base from which to make highly accurate predictions of | |
3950 framesizes at a chosen quantizer. In practice, the overall quality | |
3951 gain from this is usually close to zero, and quite possibly a third | |
3952 pass will result in slightly worse global PSNR than the pass before | |
3953 it. In typical usage, three passes help if you get either bad bitrate | |
3954 prediction or bad looking scene transitions when using only two passes. | |
3955 This is somewhat likely to happen on extremely short clips. There are | |
3956 also a few special cases in which three (or more) passes are handy | |
3957 for advanced users, but for brevity, this guide omits discussing those | |
3958 special cases. | |
3959 | |
3960 </para></listitem> | |
3961 <listitem><para> | |
3962 <emphasis role="bold">qcomp</emphasis>: | |
3963 <option>qcomp</option> trades off the number of bits allocated | |
3964 to "expensive" high-motion versus "cheap" low-motion frames. At | |
3965 one extreme, <option>qcomp=0</option> aims for true constant | |
3966 bitrate. Typically this would make high-motion scenes look completely | |
3967 awful, while low-motion scenes would probably look absolutely | |
3968 perfect, but would also use many times more bitrate than they | |
3969 would need in order to look merely excellent. At the other extreme, | |
3970 <option>qcomp=1</option> achieves nearly constant quantization parameter | |
3971 (QP). Constant QP does not look bad, but most people think it is more | |
3972 reasonable to shave some bitrate off of the extremely expensive scenes | |
3973 (where the loss of quality is not as noticeable) and reallocate it to | |
3974 the scenes that are easier to encode at excellent quality. | |
3975 <option>qcomp</option> is set to 0.6 by default, which may be slightly | |
3976 low for many peoples' taste (0.7-0.8 are also commonly used). | |
3977 </para></listitem> | |
3978 <listitem><para> | |
3979 <emphasis role="bold">keyint</emphasis>: | |
3980 <option>keyint</option> is solely for trading off file seekability against | |
3981 coding efficiency. By default, <option>keyint</option> is set to 250. In | |
3982 25fps material, this guarantees the ability to seek to within 10 seconds | |
3983 precision. If you think it would be important and useful to be able to | |
3984 seek within 5 seconds of precision, set <option>keyint=125</option>; | |
3985 this will hurt quality/bitrate slightly. If you care only about quality | |
3986 and not about seekability, you can set it to much higher values | |
3987 (understanding that there are diminishing returns which may become | |
3988 vanishingly low, or even zero). The video stream will still have seekable | |
3989 points as long as there are some scene changes. | |
3990 </para></listitem> | |
3991 <listitem><para> | |
3992 <emphasis role="bold">deblock</emphasis>: | |
3993 This topic is going to be a bit controversial. | |
3994 </para> | |
3995 <para> | |
3996 H.264 defines a simple deblocking procedure on I-blocks that uses | |
3997 pre-set strengths and thresholds depending on the QP of the block | |
3998 in question. | |
3999 By default, high QP blocks are filtered heavily, and low QP blocks | |
4000 are not deblocked at all. | |
4001 The pre-set strengths defined by the standard are well-chosen and | |
4002 the odds are very good that they are PSNR-optimal for whatever | |
4003 video you are trying to encode. | |
4004 The <option>deblock</option> allow you to specify offsets to the preset deblocking | |
4005 thresholds. | |
4006 </para> | |
4007 <para> | |
4008 Many people seem to think it is a good idea to lower the deblocking | |
4009 filter strength by large amounts (say, -3). | |
4010 This is however almost never a good idea, and in most cases, | |
4011 people who are doing this do not understand very well how | |
4012 deblocking works by default. | |
4013 </para> | |
4014 <para> | |
4015 The first and most important thing to know about the in-loop | |
4016 deblocking filter is that the default thresholds are almost always | |
4017 PSNR-optimal. | |
4018 In the rare cases that they are not optimal, the ideal offset is | |
4019 plus or minus 1. | |
4020 Adjusting deblocking parameters by a larger amount is almost | |
4021 guaranteed to hurt PSNR. | |
4022 Strengthening the filter will smear more details; weakening the | |
4023 filter will increase the appearance of blockiness. | |
4024 </para> | |
4025 <para> | |
4026 It is definitely a bad idea to lower the deblocking thresholds if | |
4027 your source is mainly low in spacial complexity (i.e., not a lot | |
4028 of detail or noise). | |
4029 The in-loop filter does a rather excellent job of concealing | |
4030 the artifacts that occur. | |
4031 If the source is high in spacial complexity, however, artifacts | |
4032 are less noticeable. | |
4033 This is because the ringing tends to look like detail or noise. | |
4034 Human visual perception easily notices when detail is removed, | |
4035 but it does not so easily notice when the noise is wrongly | |
4036 represented. | |
4037 When it comes to subjective quality, noise and detail are somewhat | |
4038 interchangeable. | |
4039 By lowering the deblocking filter strength, you are most likely | |
4040 increasing error by adding ringing artifacts, but the eye does | |
4041 not notice because it confuses the artifacts with detail. | |
4042 </para> | |
4043 | |
4044 <para> | |
4045 This <emphasis role="bold">still</emphasis> does not justify | |
4046 lowering the deblocking filter strength, however. | |
4047 You can generally get better quality noise from postprocessing. | |
4048 If your H.264 encodes look too blurry or smeared, try playing with | |
4049 <option>-vf noise</option> when you play your encoded movie. | |
4050 <option>-vf noise=8a:4a</option> should conceal most mild | |
4051 artifacting. | |
4052 It will almost certainly look better than the results you | |
4053 would have gotten just by fiddling with the deblocking filter. | |
4054 </para></listitem> | |
4055 </itemizedlist> | |
4056 </sect3> | |
4057 </sect2> | |
4058 | |
4059 <sect2 id="menc-feat-x264-example-settings"> | |
4060 <title>Encoding setting examples</title> | |
4061 | |
4062 <para> | |
4063 The following settings are examples of different encoding | |
4064 option combinations that affect the speed vs quality tradeoff | |
4065 at the same target bitrate. | |
4066 </para> | |
4067 | |
4068 <para> | |
4069 All the encoding settings were tested on a 720x448 @30000/1001 fps | |
4070 video sample, the target bitrate was 900kbps, and the machine was an | |
4071 AMD-64 3400+ at 2400 MHz in 64 bits mode. | |
4072 Each encoding setting features the measured encoding speed (in | |
4073 frames per second) and the PSNR loss (in dB) compared to the "very | |
4074 high quality" setting. | |
4075 Please understand that depending on your source, your machine type | |
4076 and development advancements, you may get very different results. | |
4077 </para> | |
4078 | |
4079 <para> | |
4080 <informaltable frame="all"> | |
4081 <tgroup cols="4"> | |
4082 <thead> | |
4083 <row><entry>Description</entry><entry>Encoding options</entry><entry>speed (in fps)</entry><entry>Relative PSNR loss (in dB)</entry></row> | |
4084 </thead> | |
4085 <tbody> | |
4086 <row> | |
4087 <entry>Very high quality</entry> | |
4088 <entry><option>subq=6:partitions=all:8x8dct:me=umh:frameref=5:bframes=3:b_pyramid:weight_b</option></entry> | |
4089 <entry>6fps</entry> | |
4090 <entry>0dB</entry> | |
4091 </row> | |
4092 <row> | |
4093 <entry>High quality</entry> | |
4094 <entry><option>subq=5:8x8dct:frameref=2:bframes=3:b_pyramid:weight_b</option></entry> | |
4095 <entry>13fps</entry> | |
4096 <entry>-0.89dB</entry> | |
4097 </row> | |
4098 <row> | |
4099 <entry>Fast</entry> | |
4100 <entry><option>subq=4:bframes=2:b_pyramid:weight_b</option></entry> | |
4101 <entry>17fps</entry> | |
4102 <entry>-1.48dB</entry> | |
4103 </row> | |
4104 </tbody> | |
4105 </tgroup> | |
4106 </informaltable> | |
4107 </para> | |
4108 </sect2> | |
4109 | |
4110 </sect1> | |
4111 | |
4112 <sect1 id="menc-feat-video-for-windows"> | |
4113 <title>Encoding with the <systemitem class="library">Video For Windows</systemitem> codec family</title> | |
4114 | |
4115 <para> | |
4116 Video for Windows provides simple encoding by means of binary video codecs. | |
4117 You can encode with the following codecs (if you have more, please tell us!) | |
4118 </para> | |
4119 <para> | |
4120 Note that support for this is very experimental and some codecs may not work | |
4121 correctly. Some codecs will only work in certain colorspaces, try | |
4122 <option>-vf format=bgr24</option> and <option>-vf format=yuy2</option> | |
4123 if a codec fails or gives wrong output. | |
4124 </para> | |
4125 | |
4126 <sect2 id="menc-feat-enc-vfw-video-codecs"> | |
4127 <title>Video for Windows supported codecs</title> | |
4128 | |
4129 <para> | |
4130 <informaltable frame="all"> | |
4131 <tgroup cols="4"> | |
4132 <thead> | |
4133 <row> | |
4134 <entry>Video codec file name</entry> | |
4135 <entry>Description (FourCC)</entry> | |
4136 <entry>md5sum</entry> | |
4137 <entry>Comment</entry> | |
4138 </row> | |
4139 </thead> | |
4140 <tbody> | |
4141 <row> | |
4142 <entry>aslcodec_vfw.dll</entry> | |
4143 <entry>Alparysoft lossless codec vfw (ASLC)</entry> | |
4144 <entry>608af234a6ea4d90cdc7246af5f3f29a</entry> | |
4145 <entry></entry> | |
4146 </row> | |
4147 <row> | |
4148 <entry>avimszh.dll</entry> | |
4149 <entry>AVImszh (MSZH)</entry> | |
4150 <entry>253118fe1eedea04a95ed6e5f4c28878</entry> | |
4151 <entry>needs <option>-vf format</option></entry> | |
4152 </row> | |
4153 <row> | |
4154 <entry>avizlib.dll</entry> | |
4155 <entry>AVIzlib (ZLIB)</entry> | |
4156 <entry>2f1cc76bbcf6d77d40d0e23392fa8eda</entry> | |
4157 <entry></entry> | |
4158 </row> | |
4159 <row> | |
4160 <entry>divx.dll</entry> | |
4161 <entry>DivX4Windows-VFW</entry> | |
4162 <entry>acf35b2fc004a89c829531555d73f1e6</entry> | |
4163 <entry></entry> | |
4164 </row> | |
4165 <row> | |
4166 <entry>huffyuv.dll</entry> | |
4167 <entry>HuffYUV (lossless) (HFYU)</entry> | |
4168 <entry>b74695b50230be4a6ef2c4293a58ac3b</entry> | |
4169 <entry></entry> | |
4170 </row> | |
4171 <row> | |
4172 <entry>iccvid.dll</entry> | |
4173 <entry>Cinepak Video (cvid)</entry> | |
4174 <entry>cb3b7ee47ba7dbb3d23d34e274895133</entry> | |
4175 <entry></entry> | |
4176 </row> | |
4177 <row> | |
4178 <entry>icmw_32.dll</entry> | |
4179 <entry>Motion Wavelets (MWV1)</entry> | |
4180 <entry>c9618a8fc73ce219ba918e3e09e227f2</entry> | |
4181 <entry></entry> | |
4182 </row> | |
4183 <row> | |
4184 <entry>jp2avi.dll</entry> | |
4185 <entry>ImagePower MJPEG2000 (IPJ2)</entry> | |
4186 <entry>d860a11766da0d0ea064672c6833768b</entry> | |
4187 <entry><option>-vf flip</option></entry> | |
4188 </row> | |
4189 <row> | |
4190 <entry>m3jp2k32.dll</entry> | |
4191 <entry>Morgan MJPEG2000 (MJ2C)</entry> | |
4192 <entry>f3c174edcbaef7cb947d6357cdfde7ff</entry> | |
4193 <entry></entry> | |
4194 </row> | |
4195 <row> | |
4196 <entry>m3jpeg32.dll</entry> | |
4197 <entry>Morgan Motion JPEG Codec (MJPG)</entry> | |
4198 <entry>1cd13fff5960aa2aae43790242c323b1</entry> | |
4199 <entry></entry> | |
4200 </row> | |
4201 <row> | |
4202 <entry>mpg4c32.dll</entry> | |
4203 <entry>Microsoft MPEG-4 v1/v2</entry> | |
4204 <entry>b5791ea23f33010d37ab8314681f1256</entry> | |
4205 <entry></entry> | |
4206 </row> | |
4207 <row> | |
4208 <entry>tsccvid.dll</entry> | |
4209 <entry>TechSmith Camtasia Screen Codec (TSCC)</entry> | |
4210 <entry>8230d8560c41d444f249802a2700d1d5</entry> | |
4211 <entry>shareware error on windows</entry> | |
4212 </row> | |
4213 <row> | |
4214 <entry>vp31vfw.dll</entry> | |
4215 <entry>On2 Open Source VP3 Codec (VP31)</entry> | |
4216 <entry>845f3590ea489e2e45e876ab107ee7d2</entry> | |
4217 <entry></entry> | |
4218 </row> | |
4219 <row> | |
4220 <entry>vp4vfw.dll</entry> | |
4221 <entry>On2 VP4 Personal Codec (VP40)</entry> | |
4222 <entry>fc5480a482ccc594c2898dcc4188b58f</entry> | |
4223 <entry></entry> | |
4224 </row> | |
4225 <row> | |
4226 <entry>vp6vfw.dll</entry> | |
4227 <entry>On2 VP6 Personal Codec (VP60)</entry> | |
4228 <entry>04d635a364243013898fd09484f913fb</entry> | |
4229 <entry>crashing on Linux</entry> | |
4230 </row> | |
4231 <row> | |
4232 <entry>vp7vfw.dll</entry> | |
4233 <entry>On2 VP7 Personal Codec (VP70)</entry> | |
4234 <entry>cb4cc3d4ea7c94a35f1d81c3d750bc8d</entry> | |
4235 <entry>wrong FourCC?</entry> | |
4236 </row> | |
4237 <row> | |
4238 <entry>ViVD2.dll</entry> | |
4239 <entry>SoftMedia ViVD V2 codec VfW (GXVE)</entry> | |
4240 <entry>a7b4bf5cac630bb9262c3f80d8a773a1</entry> | |
4241 <entry></entry> | |
4242 </row> | |
4243 <row> | |
4244 <entry>msulvc06.DLL</entry> | |
4245 <entry>MSU Lossless codec (MSUD)</entry> | |
4246 <entry>294bf9288f2f127bb86f00bfcc9ccdda</entry> | |
4247 <entry> | |
4248 Decodable by <application>Window Media Player</application>, | |
4249 not <application>MPlayer</application> (yet). | |
4250 </entry> | |
4251 </row> | |
4252 <row> | |
4253 <entry>camcodec.dll</entry> | |
4254 <entry>CamStudio lossless video codec (CSCD)</entry> | |
4255 <entry>0efe97ce08bb0e40162ab15ef3b45615</entry> | |
4256 <entry>sf.net/projects/camstudio</entry> | |
4257 </row> | |
4258 </tbody> | |
4259 </tgroup> | |
4260 </informaltable> | |
4261 | |
4262 The first column contains the codec names that should be passed after the | |
4263 <literal>codec</literal> parameter, like: <option>-xvfwopts codec=divx.dll</option> | |
4264 The FourCC code used by each codec is given in the parentheses. | |
4265 </para> | |
4266 <informalexample> | |
4267 <para> | |
4268 An example with VP3 compression: | |
4269 <screen>mencoder dvd://2 -o title2.avi -ovc vfw -xvfwopts codec=vp31vfw.dll -oac copy</screen> | |
4270 </para> | |
4271 </informalexample> | |
4272 </sect2> | |
4273 </sect1> | |
4274 | |
4275 | |
4276 <sect1 id="menc-feat-vcd-dvd"> | |
4277 <title>Using <application>MEncoder</application> to create VCD/SVCD/DVD-compliant files.</title> | |
4278 | |
4279 <sect2 id="menc-feat-vcd-dvd-constraints"> | |
4280 <title>Format Constraints</title> | |
4281 <para> | |
4282 <application>MEncoder</application> is capable of creating VCD, SCVD | |
4283 and DVD format MPEG files using the | |
4284 <systemitem class="library">libavcodec</systemitem> library. | |
4285 These files can then be used in conjunction with | |
4286 <ulink url="http://www.gnu.org/software/vcdimager/vcdimager.html">vcdimager</ulink> | |
4287 or | |
4288 <ulink url="http://dvdauthor.sourceforge.net/">dvdauthor</ulink> | |
4289 to create discs that will play on a standard set-top player. | |
4290 </para> | |
4291 | |
4292 <para> | |
4293 The DVD, SVCD, and VCD formats are subject to heavy constraints. | |
4294 Only a small selection of encoded picture sizes and aspect ratios are | |
4295 available. | |
4296 If your movie does not already meet these requirements, you may have | |
4297 to scale,crop or add black borders to the picture to make it | |
4298 compliant. | |
4299 </para> | |
4300 | |
4301 <sect3 id="menc-feat-vcd-dvd-constraints-resolution"> | |
4302 <title>Format Constraints</title> | |
4303 | |
4304 <informaltable frame="all"> | |
4305 <tgroup cols="9"> | |
4306 <thead> | |
4307 <row> | |
4308 <entry>Format</entry> | |
4309 <entry>Resolution</entry> | |
4310 <entry>V. Codec</entry> | |
4311 <entry>V. Bitrate</entry> | |
4312 <entry>Sample Rate</entry> | |
4313 <entry>A. Codec</entry> | |
4314 <entry>A. Bitrate</entry> | |
4315 <entry>FPS</entry> | |
4316 <entry>Aspect</entry> | |
4317 </row> | |
4318 </thead> | |
4319 <tbody> | |
4320 <row> | |
4321 <entry>NTSC DVD</entry> | |
4322 <entry>720x480, 704x480, 352x480, 352x240</entry> | |
4323 <entry>MPEG-2</entry> | |
4324 <entry>9800 kbps</entry> | |
4325 <entry>48000 Hz</entry> | |
4326 <entry>AC3,PCM</entry> | |
4327 <entry>1536 kbps (max)</entry> | |
4328 <entry>30000/1001, 24000/1001</entry> | |
4329 <entry>4:3, 16:9 (only for 720x480)</entry> | |
4330 </row> | |
4331 <row> | |
4332 <entry>NTSC DVD</entry> | |
4333 <entry>352x240<footnote id='fn-rare-resolutions'><para> | |
4334 These resolutions are rarely used for DVDs because | |
4335 they are fairly low quality.</para></footnote></entry> | |
4336 <entry>MPEG-1</entry> | |
4337 <entry>1856 kbps</entry> | |
4338 <entry>48000 Hz</entry> | |
4339 <entry>AC3,PCM</entry> | |
4340 <entry>1536 kbps (max)</entry> | |
4341 <entry>30000/1001, 24000/1001</entry> | |
4342 <entry>4:3, 16:9</entry> | |
4343 </row> | |
4344 <row> | |
4345 <entry>NTSC SVCD</entry> | |
4346 <entry>480x480</entry> | |
4347 <entry>MPEG-2</entry> | |
4348 <entry>2600 kbps</entry> | |
4349 <entry>44100 Hz</entry> | |
4350 <entry>MP2</entry> | |
4351 <entry>384 kbps (max)</entry> | |
4352 <entry>30000/1001</entry> | |
4353 <entry>4:3</entry> | |
4354 </row> | |
4355 <row> | |
4356 <entry>NTSC VCD</entry> | |
4357 <entry>352x240</entry> | |
4358 <entry>MPEG-1</entry> | |
4359 <entry>1150 kbps</entry> | |
4360 <entry>44100 Hz</entry> | |
4361 <entry>MP2</entry> | |
4362 <entry>224 kbps</entry> | |
4363 <entry>24000/1001, 30000/1001</entry> | |
4364 <entry>4:3</entry> | |
4365 </row> | |
4366 <row> | |
4367 <entry>PAL DVD</entry> | |
4368 <entry>720x576, 704x576, 352x576, 352x288</entry> | |
4369 <entry>MPEG-2</entry> | |
4370 <entry>9800 kbps</entry> | |
4371 <entry>48000 Hz</entry> | |
4372 <entry>MP2,AC3,PCM</entry> | |
4373 <entry>1536 kbps (max)</entry> | |
4374 <entry>25</entry> | |
4375 <entry>4:3, 16:9 (only for 720x576)</entry> | |
4376 </row> | |
4377 <row> | |
4378 <entry>PAL DVD</entry> | |
4379 <entry>352x288<footnoteref linkend='fn-rare-resolutions'/></entry> | |
4380 <entry>MPEG-1</entry> | |
4381 <entry>1856 kbps</entry> | |
4382 <entry>48000 Hz</entry> | |
4383 <entry>MP2,AC3,PCM</entry> | |
4384 <entry>1536 kbps (max)</entry> | |
4385 <entry>25</entry> | |
4386 <entry>4:3, 16:9</entry> | |
4387 </row> | |
4388 <row> | |
4389 <entry>PAL SVCD</entry> | |
4390 <entry>480x576</entry> | |
4391 <entry>MPEG-2</entry> | |
4392 <entry>2600 kbps</entry> | |
4393 <entry>44100 Hz</entry> | |
4394 <entry>MP2</entry> | |
4395 <entry>384 kbps (max)</entry> | |
4396 <entry>25</entry> | |
4397 <entry>4:3</entry> | |
4398 </row> | |
4399 <row> | |
4400 <entry>PAL VCD</entry> | |
4401 <entry>352x288</entry> | |
4402 <entry>MPEG-1</entry> | |
4403 <entry>1152 kbps</entry> | |
4404 <entry>44100 Hz</entry> | |
4405 <entry>MP2</entry> | |
4406 <entry>224 kbps</entry> | |
4407 <entry>25</entry> | |
4408 <entry>4:3</entry> | |
4409 </row> | |
4410 </tbody> | |
4411 </tgroup> | |
4412 </informaltable> | |
4413 | |
4414 <para> | |
4415 If your movie has 2.35:1 aspect (most recent action movies), you will | |
4416 have to add black borders or crop the movie down to 16:9 to make a DVD | |
4417 or VCD. | |
4418 If you add black borders, try to align them at 16-pixel boundaries in | |
4419 order to minimize the impact on encoding performance. | |
4420 Thankfully DVD has sufficiently excessive bitrate that you do not have | |
4421 to worry too much about encoding efficiency, but SVCD and VCD are | |
4422 highly bitrate-starved and require effort to obtain acceptable quality. | |
4423 </para> | |
4424 </sect3> | |
4425 | |
4426 <sect3 id="menc-feat-vcd-dvd-constraints-gop"> | |
4427 <title>GOP Size Constraints</title> | |
4428 <para> | |
4429 DVD, VCD, and SVCD also constrain you to relatively low | |
4430 GOP (Group of Pictures) sizes. | |
4431 For 30 fps material the largest allowed GOP size is 18. | |
4432 For 25 or 24 fps, the maximum is 15. | |
4433 The GOP size is set using the <option>keyint</option> option. | |
4434 </para> | |
4435 </sect3> | |
4436 | |
4437 <sect3 id="menc-feat-vcd-dvd-constraints-bitrate"> | |
4438 <title>Bitrate Constraints</title> | |
4439 <para> | |
4440 VCD video is required to be CBR at 1152 kbps. | |
4441 This highly limiting constraint also comes along with an extremly low vbv | |
4442 buffer size of 327 kilobits. | |
4443 SVCD allows varying video bitrates up to 2500 kbps, and a somewhat less | |
4444 restrictive vbv buffer size of 917 kilobits is allowed. | |
4445 DVD video bitrates may range anywhere up to 9800 kbps (though typical | |
4446 bitrates are about half that), and the vbv buffer size is 1835 kilobits. | |
4447 </para> | |
4448 </sect3> | |
4449 </sect2> | |
4450 | |
4451 <sect2 id="menc-feat-vcd-dvd-output"> | |
4452 <title>Output Options</title> | |
4453 <para> | |
4454 <application>MEncoder</application> has options to control the output | |
4455 format. | |
4456 Using these options we can instruct it to create the correct type of | |
4457 file. | |
4458 </para> | |
4459 | |
4460 <para> | |
4461 The options for VCD and SVCD are called xvcd and xsvcd, because they | |
4462 are extended formats. | |
4463 They are not strictly compliant, mainly because the output does not | |
4464 contain scan offsets. | |
4465 If you need to generate an SVCD image, you should pass the output file | |
4466 to | |
4467 <ulink url="http://www.gnu.org/software/vcdimager/vcdimager.html">vcdimager</ulink>. | |
4468 </para> | |
4469 | |
4470 <para> | |
4471 VCD: | |
4472 <screen> | |
4473 -of mpeg -mpegopts format=xvcd | |
4474 </screen> | |
4475 </para> | |
4476 | |
4477 <para> | |
4478 SVCD: | |
4479 <screen> | |
4480 -of mpeg -mpegopts format=xsvcd | |
4481 </screen> | |
4482 </para> | |
4483 | |
4484 <para> | |
4485 DVD (with timestamps on every frame, if possible): | |
4486 <screen> | |
4487 -of mpeg -mpegopts format=dvd:tsaf | |
4488 </screen> | |
4489 </para> | |
4490 | |
4491 <para> | |
4492 DVD with NTSC Pullup: | |
4493 <screen> | |
4494 -of mpeg -mpegopts format=dvd:tsaf:telecine -ofps 24000/1001 | |
4495 </screen> | |
4496 This allows 24000/1001 fps progressive content to be encoded at 30000/1001 | |
4497 fps whilst maintaing DVD-compliance. | |
4498 </para> | |
4499 | |
4500 <sect3 id="menc-feat-vcd-dvd-output-aspect"> | |
4501 <title>Aspect Ratio</title> | |
4502 <para> | |
4503 The aspect argument of <option>-lavcopts</option> is used to encode | |
4504 the aspect ratio of the file. | |
4505 During playback the aspect ratio is used to restore the video to the | |
4506 correct size. | |
4507 </para> | |
4508 | |
4509 <para> | |
4510 16:9 or "Widescreen" | |
4511 <screen> | |
4512 -lavcopts aspect=16/9 | |
4513 </screen> | |
4514 </para> | |
4515 | |
4516 <para> | |
4517 4:3 or "Fullscreen" | |
4518 <screen> | |
4519 -lavcopts aspect=4/3 | |
4520 </screen> | |
4521 </para> | |
4522 | |
4523 <para> | |
4524 2.35:1 or "Cinemascope" NTSC | |
4525 <screen> | |
4526 -vf scale=720:368,expand=720:480 -lavcopts aspect=16/9 | |
4527 </screen> | |
4528 To calculate the correct scaling size, use the expanded NTSC width of | |
4529 854/2.35 = 368 | |
4530 </para> | |
4531 | |
4532 <para> | |
4533 2.35:1 or "Cinemascope" PAL | |
4534 <screen> | |
4535 -vf scale="720:432,expand=720:576 -lavcopts aspect=16/9 | |
4536 </screen> | |
4537 To calculate the correct scaling size, use the expanded PAL width of | |
4538 1024/2.35 = 432 | |
4539 </para> | |
4540 | |
4541 </sect3> | |
4542 | |
4543 <sect3 id="menc-feat-vcd-dvd-a-v-sync"> | |
4544 <title>Maintaining A/V sync</title> | |
4545 <para> | |
4546 In order to maintain audio/video synchronization throughout the encode, | |
4547 <application>MEncoder</application> has to drop or duplicate frames. | |
4548 This works rather well when muxing into an AVI file, but is almost | |
4549 guaranteed to fail to maintain A/V sync with other muxers such as MPEG. | |
4550 This is why it is necessary to append the | |
4551 <option>harddup</option> video filter at the end of the filter chain | |
4552 to avoid this kind of problem. | |
4553 You can find more technical information about <option>harddup</option> | |
4554 in the section | |
4555 <link linkend="menc-feat-dvd-mpeg4-muxing-filter-issues">Improving muxing and A/V sync reliability</link> | |
4556 or in the manual page. | |
4557 </para> | |
4558 </sect3> | |
4559 | |
4560 <sect3 id="menc-feat-vcd-dvd-output-srate"> | |
4561 <title>Sample Rate Conversion</title> | |
4562 <para> | |
4563 If the audio sample rate in the original file is not the same as | |
4564 required by the target format, sample rate conversion is required. | |
4565 This is achieved using the <option>-srate</option> option and | |
4566 the <option>-af lavcresample</option> audio filter together. | |
4567 </para> | |
4568 <para> | |
4569 DVD: | |
4570 <screen> | |
4571 -srate 48000 -af lavcresample=48000 | |
4572 </screen> | |
4573 </para> | |
4574 <para> | |
4575 VCD and SVCD: | |
4576 <screen> | |
4577 -srate 44100 -af lavcresample=44100 | |
4578 </screen> | |
4579 </para> | |
4580 </sect3> | |
4581 </sect2> | |
4582 | |
4583 <sect2 id="menc-feat-vcd-dvd-lavc"> | |
4584 <title>Using libavcodec for VCD/SVCD/DVD Encoding</title> | |
4585 | |
4586 <sect3 id="menc-feat-vcd-dvd-lavc-intro"> | |
4587 <title>Introduction</title> | |
4588 <para> | |
4589 <systemitem class="library">libavcodec</systemitem> can be used to | |
4590 create VCD/SVCD/DVD compliant video by using the appropriate options. | |
4591 </para> | |
4592 </sect3> | |
4593 | |
4594 <sect3 id="menc-feat-vcd-dvd-lavc-options"> | |
4595 <title>lavcopts</title> | |
4596 <para> | |
4597 This is a list of fields in <option>-lavcopts</option> that you may | |
4598 be required to change in order to make a complaint movie for VCD, SVCD, | |
4599 or DVD: | |
4600 </para> | |
4601 | |
4602 <itemizedlist> | |
4603 <listitem><para> | |
4604 <emphasis role="bold">acodec</emphasis>: | |
4605 <option>mp2</option> for VCD, SVCD, or PAL DVD; | |
4606 <option>ac3</option> is most commonly used for DVD. | |
4607 PCM audio may also be used for DVD, but this is mostly a big waste of | |
4608 space. | |
4609 Note that MP3 audio is not compliant for any of these formats, but | |
4610 players often have no problem playing it anyway. | |
4611 </para></listitem> | |
4612 | |
4613 <listitem><para> | |
4614 <emphasis role="bold">abitrate</emphasis>: | |
4615 224 for VCD; up to 384 for SVCD; up to 1536 for DVD, but commonly | |
4616 used values range from 192 kbps for stereo to 384 kbps for 5.1 channel | |
4617 sound. | |
4618 </para></listitem> | |
4619 | |
4620 <listitem><para> | |
4621 <emphasis role="bold">vcodec</emphasis>: | |
4622 <option>mpeg1video</option> for VCD; | |
4623 <option>mpeg2video</option> for SVCD; | |
4624 <option>mpeg2video</option> is usually used for DVD but you may also use | |
4625 <option>mpeg1video</option> for CIF resolutions. | |
4626 </para></listitem> | |
4627 | |
4628 <listitem><para> | |
4629 <emphasis role="bold">keyint</emphasis>: | |
4630 Used to set the GOP size. | |
4631 18 for 30fps material, or 15 for 25/24 fps material. | |
4632 Commercial producers seem to prefer keyframe intervals of 12. | |
4633 It is possible to make this much larger and still retain compatibility | |
4634 with most players. | |
4635 A <option>keyint</option> of 25 should never cause any problems. | |
4636 </para></listitem> | |
4637 | |
4638 <listitem><para> | |
4639 <emphasis role="bold">vrc_buf_size</emphasis>: | |
4640 327 for VCD, 917 for SVCD, and 1835 for DVD. | |
4641 </para></listitem> | |
4642 | |
4643 <listitem><para> | |
4644 <emphasis role="bold">vrc_minrate</emphasis>: | |
4645 1152, for VCD. May be left alone for SVCD and DVD. | |
4646 </para></listitem> | |
4647 | |
4648 <listitem><para> | |
4649 <emphasis role="bold">vrc_maxrate</emphasis>: | |
4650 1152 for VCD; 2500 for SVCD; 9800 for DVD. | |
4651 For SVCD and DVD, you might wish to use lower values depending on your | |
4652 own personal preferences and requirements. | |
4653 </para></listitem> | |
4654 | |
4655 <listitem><para> | |
4656 <emphasis role="bold">vbitrate</emphasis>: | |
4657 1152 for VCD; | |
4658 up to 2500 for SVCD; | |
4659 up to 9800 for DVD. | |
4660 For the latter two formats, vbitrate should be set based on personal | |
4661 preference. | |
4662 For instance, if you insist on fitting 20 or so hours on a DVD, you | |
4663 could use vbitrate=400. | |
4664 The resulting video quality would probably be quite bad. | |
4665 If you are trying to squeeze out the maximum possible quality on a DVD, | |
4666 use vbitrate=9800, but be warned that this could constrain you to less | |
4667 than an hour of video on a single-layer DVD. | |
4668 </para></listitem> | |
4669 </itemizedlist> | |
4670 </sect3> | |
4671 | |
4672 <sect3 id="menc-feat-vcd-dvd-lavc-examples"> | |
4673 <title>Examples</title> | |
4674 <para> | |
4675 This is a typical minimum set of <option>-lavcopts</option> for | |
4676 encoding video: | |
4677 </para> | |
4678 <para> | |
4679 VCD: | |
4680 <screen> | |
4681 -lavcopts vcodec=mpeg1video:vrc_buf_size=327:vrc_minrate=1152:\ | |
4682 vrc_maxrate=1152:vbitrate=1152:keyint=15:acodec=mp2 | |
4683 </screen> | |
4684 </para> | |
4685 | |
4686 <para> | |
4687 SVCD: | |
4688 <screen> | |
4689 -lavcopts vcodec=mpeg2video:vrc_buf_size=917:vrc_maxrate=2500:vbitrate=1800:\ | |
4690 keyint=15:acodec=mp2 | |
4691 </screen> | |
4692 </para> | |
4693 | |
4694 <para> | |
4695 DVD: | |
4696 <screen> | |
4697 -lavcopts vcodec=mpeg2video:vrc_buf_size=1835:vrc_maxrate=9800:vbitrate=5000:\ | |
4698 keyint=15:acodec=ac3 | |
4699 </screen> | |
4700 </para> | |
4701 | |
4702 </sect3> | |
4703 | |
4704 <sect3 id="menc-feat-vcd-dvd-lavc-advanced"> | |
4705 <title>Advanced Options</title> | |
4706 <para> | |
4707 For higher quality encoding, you may also wish to add quality-enhancing | |
4708 options to lavcopts, such as <option>trell</option>, | |
4709 <option>mbd=2</option>, and others. | |
4710 Note that <option>qpel</option> and <option>v4mv</option>, while often | |
4711 useful with MPEG-4, are not usable with MPEG-1 or MPEG-2. | |
4712 Also, if you are trying to make a very high quality DVD encode, it may | |
4713 be useful to add <option>dc=10</option> to lavcopts. | |
4714 Doing so may help reduce the appearance of blocks in flat-colored areas. | |
4715 Putting it all together, this is an example of a set of lavcopts for a | |
4716 higher quality DVD: | |
4717 </para> | |
4718 | |
4719 <para> | |
4720 <screen> | |
4721 -lavcopts vcodec=mpeg2video:vrc_buf_size=1835:vrc_maxrate=9800:vbitrate=8000:\ | |
4722 keyint=15:trell:mbd=2:precmp=2:subcmp=2:cmp=2:dia=-10:predia=-10:cbp:mv0:\ | |
4723 vqmin=1:lmin=1:dc=10 | |
4724 </screen> | |
4725 </para> | |
4726 | |
4727 </sect3> | |
4728 </sect2> | |
4729 | |
4730 <sect2 id="menc-feat-vcd-dvd-audio"> | |
4731 <title>Encoding Audio</title> | |
4732 <para> | |
4733 VCD and SVCD support MPEG-1 layer II audio, using one of | |
4734 <systemitem class="library">toolame</systemitem>, | |
4735 <systemitem class="library">twolame</systemitem>, | |
4736 or <systemitem class="library">libavcodec</systemitem>'s MP2 encoder. | |
4737 The libavcodec MP2 is far from being as good as the other two libraries, | |
4738 however it should always be available to use. | |
4739 VCD only supports constant bitrate audio (CBR) whereas SVCD supports | |
4740 variable bitrate (VBR), too. | |
4741 Be careful when using VBR because some bad standalone players might not | |
4742 support it too well. | |
4743 </para> | |
4744 | |
4745 <para> | |
4746 For DVD audio, <systemitem class="library">libavcodec</systemitem>'s | |
4747 AC3 codec is used. | |
4748 </para> | |
4749 | |
4750 <sect3 id="menc-feat-vcd-dvd-audio-toolame"> | |
4751 <title>toolame</title> | |
4752 <para> | |
4753 For VCD and SVCD: | |
4754 <screen> | |
4755 -oac toolame -toolameopts br=224 | |
4756 </screen> | |
4757 </para> | |
4758 </sect3> | |
4759 | |
4760 <sect3 id="menc-feat-vcd-dvd-audio-twolame"> | |
4761 <title>twolame</title> | |
4762 <para> | |
4763 For VCD and SVCD: | |
4764 <screen> | |
4765 -oac twolame -twolameopts br=224 | |
4766 </screen> | |
4767 </para> | |
4768 </sect3> | |
4769 | |
4770 <sect3 id="menc-feat-vcd-dvd-audio-lavc"> | |
4771 <title>libavcodec</title> | |
4772 <para> | |
4773 For DVD with 2 channel sound: | |
4774 <screen> | |
4775 -oac lavc -lavcopts acodec=ac3:abitrate=192 | |
4776 </screen> | |
4777 </para> | |
4778 <para> | |
4779 For DVD with 5.1 channel sound: | |
4780 <screen> | |
4781 -channels 6 -oac lavc -lavcopts acodec=ac3:abitrate=384 | |
4782 </screen> | |
4783 </para> | |
4784 <para> | |
4785 For VCD and SVCD: | |
4786 <screen> | |
4787 -oac lavc -lavcopts acodec=mp2:abitrate=224 | |
4788 </screen> | |
4789 </para> | |
4790 </sect3> | |
4791 | |
4792 </sect2> | |
4793 | |
4794 <sect2 id="menc-feat-vcd-dvd-all"> | |
4795 <title>Putting it all Together</title> | |
4796 <para> | |
4797 This section shows some complete commands for creating VCD/SVCD/DVD | |
4798 compliant videos. | |
4799 </para> | |
4800 | |
4801 <sect3 id="menc-feat-vcd-dvd-all-pal-dvd"> | |
4802 <title>PAL DVD</title> | |
4803 <para> | |
4804 <screen> | |
4805 mencoder -oac lavc -ovc lavc -of mpeg -mpegopts format=dvd:tsaf -vf scale=720:576,\ | |
4806 harddup -srate 48000 -af lavcresample=48000 -lavcopts vcodec=mpeg2video:\ | |
4807 vrc_buf_size=1835:vrc_maxrate=9800:vbitrate=5000:keyint=15:acodec=ac3:\ | |
4808 abitrate=192:aspect=16/9 -ofps 25 \ | |
4809 -o <replaceable>movie.mpg</replaceable> <replaceable>movie.avi</replaceable> | |
4810 </screen> | |
4811 </para> | |
4812 </sect3> | |
4813 | |
4814 <sect3 id="menc-feat-vcd-dvd-all-ntsc-dvd"> | |
4815 <title>NTSC DVD</title> | |
4816 <para> | |
4817 <screen> | |
4818 mencoder -oac lavc -ovc lavc -of mpeg -mpegopts format=dvd:tsaf -vf scale=720:480,\ | |
4819 harddup -srate 48000 -af lavcresample=48000 -lavcopts vcodec=mpeg2video:\ | |
4820 vrc_buf_size=1835:vrc_maxrate=9800:vbitrate=5000:keyint=18:acodec=ac3:\ | |
4821 abitrate=192:aspect=16/9 -ofps 30000/1001 \ | |
4822 -o <replaceable>movie.mpg</replaceable> <replaceable>movie.avi</replaceable> | |
4823 </screen> | |
4824 </para> | |
4825 </sect3> | |
4826 | |
4827 <sect3 id="menc-feat-vcd-dvd-all-pal-ac3-copy"> | |
4828 <title>PAL AVI Containing AC3 Audio to DVD</title> | |
4829 <para> | |
4830 If the source already has AC3 audio, use -oac copy instead of re-encoding it. | |
4831 <screen> | |
4832 mencoder -oac copy -ovc lavc -of mpeg -mpegopts format=dvd:tsaf -vf scale=720:576,\ | |
4833 harddup -lavcopts vcodec=mpeg2video:vrc_buf_size=1835:vrc_maxrate=9800:\ | |
4834 vbitrate=5000:keyint=15:aspect=16/9 -ofps 25 \ | |
4835 -o <replaceable>movie.mpg</replaceable> <replaceable>movie.avi</replaceable> | |
4836 </screen> | |
4837 </para> | |
4838 </sect3> | |
4839 | |
4840 <sect3 id="menc-feat-vcd-dvd-all-ntsc-ac3-copy"> | |
4841 <title>NTSC AVI Containing AC3 Audio to DVD</title> | |
4842 <para> | |
4843 If the source already has AC3 audio, and is NTSC @ 24000/1001 fps: | |
4844 <screen> | |
4845 mencoder -oac copy -ovc lavc -of mpeg -mpegopts format=dvd:tsaf:telecine \ | |
4846 -vf scale=720:480,harddup -lavcopts vcodec=mpeg2video:vrc_buf_size=1835:\ | |
4847 vrc_maxrate=9800:vbitrate=5000:keyint=15:aspect=16/9 -ofps 24000/1001 \ | |
4848 -o <replaceable>movie.mpg</replaceable> <replaceable>movie.avi</replaceable> | |
4849 </screen> | |
4850 </para> | |
4851 </sect3> | |
4852 | |
4853 <sect3 id="menc-feat-vcd-dvd-all-pal-svcd"> | |
4854 <title>PAL SVCD</title> | |
4855 <para> | |
4856 <screen> | |
4857 mencoder -oac lavc -ovc lavc -of mpeg -mpegopts format=xsvcd -vf \ | |
4858 scale=480:576,harddup -srate 44100 -af lavcresample=44100 -lavcopts \ | |
4859 vcodec=mpeg2video:mbd=2:keyint=15:vrc_buf_size=917:vrc_minrate=600:\ | |
4860 vbitrate=2500:vrc_maxrate=2500:acodec=mp2:abitrate=224 -ofps 25 \ | |
4861 -o <replaceable>movie.mpg</replaceable> <replaceable>movie.avi</replaceable> | |
4862 </screen> | |
4863 </para> | |
4864 </sect3> | |
4865 | |
4866 <sect3 id="menc-feat-vcd-dvd-all-ntsc-svcd"> | |
4867 <title>NTSC SVCD</title> | |
4868 <para> | |
4869 <screen> | |
4870 mencoder -oac lavc -ovc lavc -of mpeg -mpegopts format=xsvcd -vf \ | |
4871 scale=480:480,harddup -srate 44100 -af lavcresample=44100 -lavcopts \ | |
4872 vcodec=mpeg2video:mbd=2:keyint=18:vrc_buf_size=917:vrc_minrate=600:\ | |
4873 vbitrate=2500:vrc_maxrate=2500:acodec=mp2:abitrate=224 -ofps 30000/1001 \ | |
4874 -o <replaceable>movie.mpg</replaceable> <replaceable>movie.avi</replaceable> | |
4875 </screen> | |
4876 </para> | |
4877 </sect3> | |
4878 | |
4879 <sect3 id="menc-feat-vcd-dvd-all-pal-vcd"> | |
4880 <title>PAL VCD</title> | |
4881 <para> | |
4882 <screen> | |
4883 mencoder -oac lavc -ovc lavc -of mpeg -mpegopts format=xvcd -vf \ | |
4884 scale=352:288,harddup -srate 44100 -af lavcresample=44100 -lavcopts \ | |
4885 vcodec=mpeg1video:keyint=15:vrc_buf_size=327:vrc_minrate=1152:vbitrate=1152:\ | |
4886 vrc_maxrate=1152:acodec=mp2:abitrate=224 -ofps 25 \ | |
4887 -o <replaceable>movie.mpg</replaceable> <replaceable>movie.avi</replaceable> | |
4888 </screen> | |
4889 </para> | |
4890 </sect3> | |
4891 | |
4892 <sect3 id="menc-feat-vcd-dvd-all-ntsc-vcd"> | |
4893 <title>NTSC VCD</title> | |
4894 <para> | |
4895 <screen> | |
4896 mencoder -oac lavc -ovc lavc -of mpeg -mpegopts format=xvcd -vf \ | |
4897 scale=352:240,harddup -srate 44100 -af lavcresample=44100 -lavcopts \ | |
4898 vcodec=mpeg1video:keyint=18:vrc_buf_size=327:vrc_minrate=1152:vbitrate=1152:\ | |
4899 vrc_maxrate=1152:acodec=mp2:abitrate=224 -ofps 30000/1001 \ | |
4900 -o <replaceable>movie.mpg</replaceable> <replaceable>movie.avi</replaceable> | |
4901 </screen> | |
4902 </para> | |
4903 </sect3> | |
4904 | |
4905 </sect2> | |
4906 | |
4907 </sect1> | |
4908 | |
4909 </chapter> |