FFmpeg_常用命令

内容

  • 常用参数选项
  • 抽取视频的音频,保存为单独的文件

常用参数选项

选项 描述
-i 输入的文件
-vn disable video
-b:v 视频码率
-b:a 音频码率
-acodec/-vcodec copy 代表复用原音视频格式

抽取音频

https://superuser.com/questions/332347/how-can-i-convert-mp4-video-to-mp3-audio-with-ffmpeg

The basic command is:

1
ffmpeg -i filename.mp4 filename.mp3

or

1
ffmpeg -i video.mp4 -b:a 192K -vn music.mp3

Check this URL: MP4 Video to MP3 File Using ffmpeg (Ubuntu 9.10 Karmic Koala) link broken [Updated on 7th Dec 2021]

Note: Ubuntu does not supply FFmpeg, but the fork named Libav. The syntax is the same – just use avconv instead of ffmpeg for the above examples.


https://stackoverflow.com/questions/9913032/how-can-i-extract-audio-from-video-with-ffmpeg

To extract the audio stream without re-encoding:

1
ffmpeg -i input-video.avi -vn -acodec copy output-audio.aac
  • -vn is no video.
  • -acodec copy says use the same audio stream that’s already in there.

Read the output to see what codec it is, to set the right filename extension.

按时间范围截取

https://blog.csdn.net/u011573853/article/details/103221606

  • 截取一段音频

    1
    ffmpeg -i lesson.mp3 -ss 6:17 -to 8:25 -c copy lessson4.mp3
  • 把音频加入从头加入到视频

    1
    ffmpeg -i lessson4.mp3 -i video.mp4 -map 0:0 -map 1:1 -c copy movie.mp4
  • 截取一段视频

    1
    2
    ffmpeg -i '1.mp4' -ss 00:01:17 -t 00:10:45 -vcodec copy -acodec copy yundong.mp4
    ffmpeg -ss 00:00:10 -i input.mp4 -c copy output.mp4 # 减去前面10秒

常用操作命令总结

https://www.jianshu.com/p/341e0673bfe8

截图

1
ffmpeg -ss 00:43:55 -i video.mp4  -f image2  -vframes 1 -y frame.png

注意将ss放到最前面可以加快速度, -y代表覆盖文件 -vframes代表帧数 -i代表输入,即in;-ss也可以使用单个数字,代表秒数,从0开始计算。

去固定水印

1
ffmpeg -i video.mp4 -vf "delogo=x=1680:y=60:w=160:h=55"  -y  new_1.mp4

这里-vf表示video filter, 其中delogo的参数代表水印的坐标和大小,把视频左上角作为坐标原点,横向为x轴,纵向为y轴。这种情况除非预先知道水印的位置和大小,否则不是特别方便,当然,准确识别水印位置也是一个难点,不是很轻易能实现的。
可能根据某些ffmpeg版本不同,需要加-strict experimental 参数,一种情况是比较老的版本音频ACC属于实验阶段,可以按情况设置或者升级ffmpeg版本。

获取视频时长

1
ffprobe -v error -show_entries format=duration -of default=noprint_wrappers=1:nokey=1 new_out.mp4

ffprobe 是ffmpeg 配套的一个工具,可以查看一些内容信息。上面的命令可以直接获得秒为单位的视频时长

  1. 获取视频信息并优化展示
    ffprobe -v quiet -print_format json -show_format -show_streams pianpian.mp4
    这里-v代表日志级别,可以使用debug用来分析某些异常; 上面的命令会以json格式输出formatstream两项的信息.
  2. 转码再生成m3u8
    先转为ts格式:
1
ffmpeg -y -i video.mp4 -c:v copy -c:a copy -vbsf h264_mp4toannexb output.ts

这里 -c:v, -c:a分别代表视频,音频格式,copy代表原视频格式, -vbsf或者-bsf:v(-bsf:a),表示bitstream filter,转码格式。
转换m3u8:

1
ffmpeg -i output.ts  -c copy -map 0 -f segment -segment_list index.m3u8 -segment_time 10 video_sgs/video-%03d.ts

中间参数没有太了解,功能是将视频分段并生成m3u8文件, 包括设置分段视频的长度。

视频分帧

1
ffmpeg -i src01.avi %d.jpg

将视频所有帧保存为图片。 注意整体内容可能比较大,实验中19MB的1280*720视频,分帧后的图片有3.8G。

视频加文字水印

1
ffmpeg -i input.mp4 -vf "drawtext=fontfile=simhei.ttf:text='雷':x=100:y=10:fontsize=24:fontcolor=yellow:shadowy=2" drawtext.mp4

可以给水印设置字体,大小,颜色等。 字体颜色可以用RGB代码,比如fontcolor=#FFFF00,如果要设置透明度可以这样写:fontcolor=#FFFFFF@0.6,表示0.6的透明度,取值为0.1-1.0
shadowy表示阴影。

注意: 这里冒号:是关键字,如果是要加到水印里,需要转义,用四个\下面是一个例子

1
ffmpeg -i source.mp4 -vf "drawtext=fontfile=MicroYaHei.ttf:text=By\\\\:三峡不好人:x=1240:y=44:fontsize=73:fontcolor=#FFFFFF@0.8"  -y drawtext_out.mp4

ffmpeg限制cpu数

ffmpeg在去水印,加水印的时候,默认都是占满可用CPU的,某些情况下需要限制CPU数。网上文章乱七八糟,各种抄,很多说用-threads 参数,但说的不明不白。 以下亲测,-threads参数放到 -y 前面是可以生效的, Linux 可以用top -H -p <pid> 看运行线程数来验证, 同时可以用uptime比较限制线程和不限制的CPU使用率。 如下是限制为2个线程。

1
ffmpeg -i source.mp4 -vf "drawtext=fontfile=MicroYaHei.ttf:text=By\\\\:三峡不好人:x=1240:y=44:fontsize=73:fontcolor=#FFFFFF@0.8"  -threads 2  -y drawtext_out.mp4

将多个TS文件批量转换为MP4格式

批量转换脚本

  • Windows(批处理脚本)​
    1. 新建文本文件,输入以下内容:
      1
      2
      3
      4
      5
      @echo off
      for %%i in (*.ts) do (
      ffmpeg -i "%%i" -c copy "%%~ni.mp4"
      )
      pause
    2. 保存为 convert.bat,放到TS文件所在文件夹,双击运行。
  • Linux/macOS(Shell脚本)​
    1. 新建脚本文件 convert.sh
      1
      2
      3
      4
      #!/bin/bash
      for file in *.ts; do
      ffmpeg -i "$file" -c copy "${file%.ts}.mp4"
      done
    2. 添加执行权限并运行:
      1
      2
      chmod +x convert.sh
      ./convert.sh

Windows

在Windows批处理脚本中,"%%~ni.mp4" 是一个特殊的 ​变量扩展语法,用于处理文件名。具体含义分解如下:

  • 在批处理脚本中必须使用 ​双百分号​(%%i),而在命令行直接执行时用单百分号(%i)。
符号 含义
%%i 循环变量,表示当前处理的文件名(如 video1.ts
%~ni 去掉文件名的扩展名(.ts),只保留主文件名(video1
.mp4 添加新的扩展名
%%~ni.mp4 组合后的完整新文件名(video1.mp4
其他常见变量扩展
语法 作用 示例(原文件名:D:\Videos\test.ts
%%~i 完整路径+文件名 D:\Videos\test.ts
%%~di 驱动器盘符 D:
%%~pi 文件路径(不含文件名) \Videos\
%%~ni 主文件名(不含扩展名) test
%%~xi 扩展名(包含点号) .ts
%%~fi 完整绝对路径 D:\Videos\test.ts
  • -c copy:直接复制音视频流,无需重新编码(速度快)。
  • 如需重新编码(兼容性更好,但速度慢):
1
ffmpeg -i input.ts -c:v libx264 -c:a aac output.mp4

x86体系历程

内容

比较著名的芯片体系:

  • Intel x86
  • AMD
  • ARM7/9
  • ppc
  • mips

Intel和AMD多用于PC。现在的手机、平板用的大多是ARM9,可穿戴设备大多是ppc、mips。ARM、ppc、mips实时性非常好。

读本文前需要明确:

  1. CPU位数表示ALU宽度(数据总线条数)。所以要说CPU是多少位由ALU宽度(数据总线条数)决定。
  2. CPU可寻址能力由CPU芯片上的地址总线条数决定。
  3. CPU地址总线条数不等于CPU位数。

Intel 80x86家族发展历程

每天所讲到的x86-32位体系指的是从Intel 80386芯片一直到后面所发展的一系列32位处理器。而x86并不是从32为起步,而是从1978年的8086(16位)开始发展,经过80186(16)、80286(伪32)。

  1. 1970年代
    1. 4004 – 4位
    2. 8008 – 8位
  2. 1974年代
    1. 8080 – 8位
    2. 8085 – 8位
  3. 1978年代
    1. 8086 – 16位
    2. 80186 – 16位
  4. 1983年代
    1. 80286 – 32位(伪)
    2. 80386 – 32位(真)
    3. 80486 – 32位
  5. 1993年代
    1. Pentium – 32位

8位芯片如果只有8条地址总线,那么只能寻址256字节,这样的CPU局限性太高,因此早期的8位CPU(如8080、8085)的地址总线设计成了16条,可以寻址64KB。

8位芯片的寄存器只有1个字节,但是寻找的地址是16位即2字节地址,不能全部放到一个寄存器中,需要分开存放。8位芯片导致数据位数和地址位数不对等,形成了历史包袱,所以在8080和8085中出现了很多16位的汇编指令以解决数据和地址位数不对等的问题。

到了8086芯片,是16位CPU,地址总线设计为20条,可寻址1MB。虽然数据和地址位数不对等,但是巧妙的设计可以解决这个问题,当初设计师没有按照8080、8085那样设计20位汇编指令,而是让地址入寄存器时右移4位。

开创x86体系–开始分段–实模式

从8086开始,增加了4个段寄存器,CS、DS、SS、ES,分别是代码段寄存器、数据段寄存器、堆栈段寄存器、扩展段寄存器,都是16位,可存放2字节。另外还有一个IP寄存器,也是16位,名字含义为指令指针寄存器,可专门存放内存地址偏移量,即内存地址。

此时,设计师把内存划分为分段体系,规定每个段的起始地址必须是16的倍数,所以每个段至少有16个字节,最大呢?是IP寄存器能最大支持存放的数字,即216=64KB2^{16}=64KB。此时,每一段的内容都有其段起始地址和段范围。这就可以把每一段的起始地址写到相应的段寄存器中了。

为啥规定每个段的起始地址必须是16的倍数?如果一个数字能被16整除,那么2进制下,这个数字的低四位均为0!因此可以右移四位已知的数据,把其余高位有效数据存放到16位段寄存器中!这就是巧妙之处。

由此以来,之后的寻址方式就变成:取具体对应段的段寄存器为段基址,作为地址总线高16位,再加上具体数据在段中的相对偏移量(从IP寄存器中的值取)。

如此推演:

  1. 段寄存器中的值,左移4位,对应的值就称为:段基址
  2. IP寄存器中的值,就称为一个内存段上的偏移量/偏移地址/相对地址/逻辑地址

在8086芯片开创的年代,还没有虚拟地址映射的概念,因此寻址得到的数据地址直接对应了内存上的物理地址。这样的模式,称为实地址模式,也叫实模式。

融合操作系统–保护模式

实现保护机制,就要在保存段起始地址的同时,记录段的范围,确保不要越界。同时也要给每一个段记录其访问权限。

  1. 内存段起始地址
  2. 内存段长度 - 防止偏移量(逻辑地址)越界
  3. 内存的权限信息 - 确保他人访问时合法,避免任意读取、修改、执行

虽然32位处理器是32位,但是其段寄存器的大小依旧是16位,肯定是无法存放这些全部内容的,即使有32位的寄存器也不够存储。

但在80386这个处理器上,做出了变革,增加了GTDR和LDTR两个寄存器,分别是全局段描述符表寄存器、局部段描述符表寄存器,前者是所有进程共享的,后者是每个进程私有的。

段描述符表实际上是一个数组,依次存放了每个段的信息。

因此,从前的段寄存器则需要用来存储段描述符表中本段对应的下标值。

段寄存器,共16位,低2位存储权限标志,00表示最高权限,11表示最低权限,表示当前段属于用户态/内核态下的空间。第3个低位表示当前段的信息存储在GDTR/LDTR中,0表示GDTR,1表示LDTR。剩下的高13位存储描述符表中对应的下标值。最大值为213=81922^{13}=8192。其中内核代码占用了12个全局段描述符表项,因此可用的值有8180个。

image-20220828210620727

段描述符表的表项的结构:

image-20220828210941156

段描述表中的一个表项中记录了32位段基址,20位段长度大小及其单位。

保护模式下内存分段的地址映射

段寄存器存储的值,右移3位,得到段描述符中对应的下标值。再到段描述符(GDT)中取得该段的信息(基址、大小、权限属性)。

则保护模式下内存分段的地址映射可以如下计算获得:(以取得DS数据段某地址为例)

GDT[DS>>3].BaseAddr+IP=线性地址GDT[DS>>3].BaseAddr+IP=线性地址。其中,IP要和记录的段长度进行比较,判断是否越界。

如果没有分页机制,则以上线性地址就是实际的物理地址。

保护模式下内存分页的地址映射

继续,判断内核是否打开内存页映射,标志位存储于CR0寄存器中的PG位,为0表示只分段,为1表示使用内存分页。

寄存器 描述
CR0 PG:内存是否开启分页机制
CR2 保存发生缺页异常时的虚拟地址
CR3 保存当前进程的页目录起始地址
CR4 PAE是否开启物理地址扩展

如果打开了内存分页机制,那么得到的该线性地址就称为虚拟地址,需要经过页面的多级映射,才能得到真正的物理地址。

32位下,需要二级映射;36位下,需要三级映射;64位下,需要四级映射。

拿32位举例子,分为三段,10、10、12。高10位表示页目录的下标值,次10位表示页表的下标值,低12位表示物理页面上的偏移量。

10位限制了页目录最多有1024项,每一项都是4字节,32位,则页目录本身占4KB。页目录项中存储了页表的地址。

10位限制了页表最多有1024项,每一项都是4字节,32位,则页表本身占4KB。页表项中存储了一个物理页面的起始地址。

12位限制了地址偏移量最大为4K,刚好对应于一个页面的大小4KB,确保不会确界。

因为一页是4KB,所以每一个页面的地址都是4K的整数倍,那么这些地址的低12位都为0,所以PT(页表)中的页表项的32位中只需高20位来存储物理页面号(也称作框号)。同样的道理,每个页表都是4KB,那么PG(页目录)中的页目录项的32位中只需高20位来存储页表的起始地址。剩下的12位存什么呢?权限信息(比如页有无分配?是否可访问?是否是脏页)。

其中,PT项的最低1位是present位,为0表示页表项对应的物理页面在交换分区中,为1表示此页面就在物理内存中。换页算法中需要与这个位打交道。

物理页面的结构体可在内核源码中struct page看到,命名为mem_map_t

物理页面实际上用动态开辟的数组来管理,是一个mem_map_t * mem_map。PT项的高20位即为物理页面数组的下标。

最多有1024个PG,1个PG可以映射1024个PT,1个PT可以映射1024个物理页面,1个物理页面有4KB。由此,我们可以计算得到,102410244KB=4GB1024*1024*4KB=4GB

问题:每个进程如何确保页目录、页表地址不冲突

我们可以想到,每个进程都分配了相同大小的虚拟地址空间。那么变量的地址也可能会存在相同的情况。而每个CPU都要同时执行多个进程,CR3寄存器(存放页目录地址)只有一个。每一个进程都有自己独立的地址空间,所以不同进程在切换的时候,要把自己的页目录地址更新到CR3寄存器中。

可在内核代码中switch_mm函数中看到:

1
2
3
4
5
6
7
static inline void switch_mm(struct mm_struct *prev, ...)
{
{
...
asm volatile("movl %0, %%cr3": :"r" (__pa(next->pgd)));
}
}