做原创视频说话和字幕同步是怎么做到的,有没有什么便捷的软件?

云锦悟生活


解题

原创视频就没什么好说的了,关键是说话和字幕同步!

这里其实有两个动作:

1、从视频得到字幕(含时间轴)

2、为视频配上字幕

很多答主,仅仅是做到了第二条,这个几乎所有的后编软件标配。

其实现关键的是第一条,得到字幕,这个技术含量就高了,还有准确率的要求。

因为不打算重复其它答主的劳动,主要就第一点来专题阐述一下吧。

3、这里主要为大家介绍一款强到没边的TTS工具VI


一、常用工具

二、Video Indexer (视频见解)

三、我的建议


一、常用工具

1、Arctime(PC首选)

官网地址:

https://arctime.org/

这款必须介绍,三大理由:强大、免费、简单

官网介绍如下:Arctime 是一个全新理念的可视化字幕创作软件,可以运行在Mac、Windows、Linux上。借助精准的音频波形图,可以快速创建和编辑时间轴,还可以高效的进行文本编辑、翻译。支持SRT、ASS外挂字幕格式,并可以通过交换工程文件或与伙伴协同工作。字幕编辑完成后,仅需单击“视频转码”按钮,即可轻松完成字幕压制工作。


2、快影(手机首选)

下载地址:

http://app.mi.com/details?id=com.kwai.videoeditor

这款必须介绍,三大理由:手机、免费、快速

介绍如下:快影是一款手机 App,能够自动将识别出的文字和时间轴匹配,生成字幕。视频往App里面一添加,啥事都不用干了,App 自动识别出语音,自动转化为文本,自动添加到对应的时间点,特别适合用于30秒以上长视频制作,一切都是那么简单。


3、Video Indexer(强大首选)

使用地址:

https://vi.microsoft.com/zh-hans/

今天介绍这款,三大理由:强大、强大、强大

介绍:真的如下了......


二、Video Indexer (视频见解)

语音识别等技术的快速进步,现在可以比较准确的通过智能设备自动将视频中的语音识别提取出来。Video Indexer 中文名称“视频见解”,简称VI。TTS中的佼佼者,然不也不会向您推荐。

有多强大呢,先列出来吓吓你:

  1. 隐藏式字幕:以三种格式创建隐藏式字幕:VTT、TTML、SRT。
  2. 双通道处理:自动检测、隔离脚本及合并到单个时间线。
  3. 噪声消减:清理电话音频或有噪音的录制内容(基于 Skype 滤波器)。
  4. 脚本自定义 (CRIS):训练和执行扩展的自定义语音转文本模型,以创建行业特定的脚本。
  5. 说话人枚举:映射和了解哪个说话人在何时说了哪些话。
  6. 说话人统计信息:提供说话人发言比率的统计数据。
  7. 视觉文本识别 (OCR):提取视频中显示的可视文本。
  8. 关键帧提取:检测视频中稳定的关键帧。
  9. 情绪分析:在语音和视觉文本中识别积极、消极和中性情绪。
  10. 视觉内容审核:检测成人和/或挑逗性视觉对象。
  11. 关键字提取:从语音和视觉文本中提取关键字。
  12. 标签识别:识别显示的视觉对象和动作。
  13. 品牌提取:从语音和视觉文本中提取品牌。

  14. 人脸检测:检测和分组视频中显示的人脸。
  15. 人脸缩略图提取(“最佳人脸”):在每组人脸中自动识别捕获的最佳人脸(基于质量、大小和正面位置),并将其提取为图像资产。
  16. 名人识别:视频索引器自动识别超过 100 万名名人,如世界各国领导人、男演员和女演员、运动员、研究人员、商业和科技领袖。 有关这些名人的数据也可以在各种著名网站上找到,例如 IMDB 和维基百科。
  17. 基于帐户的人脸识别:视频索引器针对特定帐户训练模型。 然后,它会根据专门为该帐户中的视频训练的模型识别视频中的人脸。
  18. 文本内容审核:检测音频脚本中的显式文本。
  19. 镜头检测:确定视频中的场景何时发生了更改。
  20. 黑帧检测:识别视频中的黑帧。
  21. 音效:识别击掌、讲话和静音等音效。
  22. 主题推理:根据脚本推理主要主题。 包括第一级 IPTC 分类。
  23. 情感检测:基于语音和音频提示识别情感。情感可能是:快乐、悲伤、愤怒或恐惧。
  24. 项目:提取每个模型的丰富的“下一种详细程度”项目。
  25. 翻译:将音频脚本翻译成 54 种不同的语言。

希望没吓着你,其实还是非常好用的,非常!

视频见解的英文名称是 Video Indexer ,也简称为 V I ,它是由“认知服务”、“云媒体分析”、 “云搜索”构建的云应用程序。它能够从视频中提取各种见解。使用视频见解的功能,你首先需要拥有一个帐号(比如O365 帐号),然后进入视频见解的官网,并按图中展示的步骤登录,进入操作状态。

视频见解,是微软最新推出的认知服务。视频见解建立在媒体 AI 技术的基础上,使从视频中提取见解变得更加容易。微软认知服务(Microsoft Cognitive Services)集合了多种智能API以及知识API。借助这些API,开发者可以开发出更智能,更有吸引力的产品。视频见解,本身就调用了多项基础认知服务 API 。主要包括 :

Face API:这是一种提供最先进人脸算法的基于云的服务。 Face API有两个主要功能:具有属性的人脸检测和人脸识别。

Microsoft Translator:开发人员可以轻松地将其集成到他们的应用程序,网站,工具或需要多语言支持的任何解决方案中,客户支持应用程序,消息应用程序, 内部沟通等等。

Computer Vision API:借助计算机视觉API,您可以分析图像,处理图像和返回信息的高级算法。

Custom Speech Service:基于云的自动翻译服务。 API使开发人员能够将端到端的实时语音翻译添加到他们的应用程序。

从视频可以提取三类十三种见解,用来丰富应用程序,来增强程序的发现和参与度。

第一类:关键见解

包括:音频转录、视觉文字识别、翻译

第二类:基础见解

包括:语音活动检测、场景检测、关键帧提取、视觉内容控制、演讲者索引

第三类:汇总见解

包括:人脸跟踪和识别、关键词提取、情绪分析、注释、品牌

生成见解,一共需要六个步骤

第一步,上传视频,将自己的视频内容上传到网站上。

第二步,视频设置,设置源语言和隐私

第三步,搜索内容,通过深度搜索视频存档内的脚本、主题或人来找到你需要的内容

第四步,浏览见解,设置翻译语言,浏览和编辑人、关键字、语音情绪等认知见解

第五步,浏览脚本,浏览视频的完整脚本和时间线上的事件

第六步,搜索视频,搜索时间线内的主题、关键字、人和其他见解

最后一种,是直接下载视频。

这里的视频,是可以再创作的,也只有重新创作过的视频,下载才有意义。

再创作分为四个步骤:

第一步:搜集素材,通过搜索和过滤找出需要重组的时间片段。

第二步:创建播放列表,要向播放列表中添加或删除行,请按+/-。

第三步:预览播放列表,完成创建播放列表后,按预览。

第四步:发布播放列表,预览播放列表后,您可以发布它。发布播放列表后,它会添加到视频洞察列表中。

再创作完成后,您就可以下载全新的视频了。

导出字幕随你用。微软官方可下载的是VTT格式,一种用于H5网站的视频字幕格式。

当您要在本地视频使用时,需要转换成SRT格式,好在这种转换非常简单。其它就不多说了。

用了就知道,其实根本不用看这个教程(帐号还是要自己先搞定的,唯一复杂的地方),上传文档,下载VTT就两步而己。加到字幕中去就不多说了,人人都会吧。


三、我的建议

PC端用Arctime

手机端用快影

想要强大用VI


原来就是这么简单!!!


史记微软


如果要说最好用的软件,当然要数Arctime了,能够精确实现语音与汉字进行同步,使用方法极其简单,而且都是免费的,官网还提供了中文教程,3分钟学不会你来找我。

下载方法

百度Arctime,然后点进去下载平常端就可以了,而且完全免费,相比其他的字母软件要简单一万倍,用Photoshop实在太麻烦,小小编当初做自媒体也是通过大神指点,培训机构学习就算了,都是坑人的,自媒体本身并不需要研究太多软件的特效。

使用方法

使用方法可以简单介绍一下,首先你要把你想说的话,打在txt上面,一行一行的打,也就是一行作为一句话,当然最好的办法还是去官网看视频,太简单,我这里就不给你一一操作了,目前个人感觉这是做好用的制作字幕的软件。绝对的良心产品。


柯南学长说


大力推荐一款神器给你,用过之后一定会很喜欢的!

我们自媒体人很多都是使用手机拍摄,并且希望直接在手机上就可以把视频剪辑出来。但是很多的软件配置视频字幕,都需要人工输入,人工校对时间,非常的麻烦。

我用的一款,它可以自动识别你的视频语音,并且自动生成字幕,时间也对的很准。

这款神器就叫做快影!

下载好之后,打开软件,然后点击左下角的视频制作。

它会直接跳入到你的手机相册里,然后你选择你的视频导入即可。

点击右下角,就可以为你迅速地识别视频中的语音,自动生成字幕。

需要你的普通话标准,并且没有其他的杂音,识别度还是很高的,校对时间也很准,如果有识别错误,还可以点击字幕进行修正。

如果对你有帮助,请关注。请转发评论,感谢。


九六郎


做为经常做视频的我也给大家介绍一个超级无敌好用的“语音转文字”方法

我们做视频的小伙伴最头疼的莫过于加字幕了,因为加字幕耗费了大家好多的时间,不过看完我的回答后,经常加字幕的你会一下变得轻松很多。

这个方法就是在网页搜索:讯飞听见

网址如下:

简单的注册登录后,看见这个收费也不要紧,因为新用户注册都会赠送2小时的免费时长

并且还有新人180元的礼券,如下:

好了,下面我开始教大家怎么用:

首先,点击“机器快转”这里,然后上传你需要添加字幕的音频,视频转音频相信做过视频的小伙伴应该都会吧?如果不会的,自己下载一个格式工厂或者魔影工厂或者其他方式自己转换,这里我就不多说了。


上传完成后,填写订单名称,选择你的音频内容的专业领域,这有助于识别字幕时能更精准。

完了,点击,创建订单。

这里因为新用户有2小时的免费时长,所以支付0元即可。点击,确认支付 是这样的

然后点击,查看订单:再点击查看结果


点击播放试听一下,看有没有错误,如果有个别识别错误的可以双击字幕进行修改。

然后再点击下载可以下载各种文字格式的文件,比如说txt文档 doc格式文档等。

如果是视频编辑用,你可以选择 字幕形式 进行下载srt字幕格式文件,方便导入剪辑软件当中使用即可。比如说:会声会影和Arctime字幕制作软件都支持导入srt字幕格式。

怎么样?有没有觉得很方便呢?


忠阳视频


有快捷软件!但要看你用什么软件剪切原创视频,本人是小白自己通过网站上面学习到专业的剪切视频软件pr。目前个人也是对Pr懂得大概的编辑,不过已经够我做的街访内容剪切了.现在我剪切视频基本用四个软件:pr/ps/AE/crd/。

我也懂得使用Arctime做字幕,这个可以直接同步文字的,但还是要修改。因为我做的视频一般字幕条只有4-5十条,所以感觉还是ps比较方便,所以一直用ps。

下面简单讲一下我做视频添加字幕的过程!(下面讲得可能有点笼统,大家可以看完实操有不懂地方私信我!但麻烦帮忙关注一下哦!)

使用pr剪切视频添加字幕。

1:首先确定视频完全剪切完,无需再做任何修改!切记,一定是无需再做修改!

2:导出视频里面的音频。

3:使用“网易外见工作台”对语音转换成字体。

<strong>

4:通过ps对改好的文字进行“变量-数据组”(这个有点麻烦,具体可以问我)

5:使用导出来的Png格式一帧一帧拉到pr里面就可以了。

6:拉入Pr

<strong>

我是一档搞笑正能量街访,喜欢可以关注我哦!


海闻热讯


目前,其实没有特别方便的软件来直接使视频与文字同步,视频上大部分的文字都是后期添加上去的,所以只能介绍几个功能齐全的软件以供参考,

1.会声会影:会声会影的功能齐全,具有强大的编辑能力,能够尽可能的满足人们的需求,可能对于刚刚入门的新手来说,需要熟悉一段时间,但一旦掌握,对我们来说绝对有很大的帮助


2.pradobe premiere:简称PR,其实大多数使用者对于PR都有良好的评论,它有着更加高速的输出精度,适合更加专业的人们使用。


3.EDIUS(ED):这款软件是由日本开发研制的非线性编辑软件,拥有完善的文件工作流程,提供了更加丰富的使用功能支持DV.摄影机,极大的方便了使用者。


凡尘一叶


你不知道有个软件叫“雷特字幕”吧。

下载“雷特字幕”,配合PR、Edius,就可以打字幕了。


温乎


有人说:“成功是没有捷径可走的”在自媒体领域做视屏的人群更是汪洋如海随意可莩取,每天头条上出产的原创视屏繁多如牛内容五花八门,但想要得到上乘的后期效果,还是得花大量时间去精心制作,这里我就推荐几个比较便捷的视频字幕和语音同步制作的软件。

快剪辑、cubase6(音乐编曲软件处理声音效果十分强悍)、EDUIS9、巧影(手机应用)这些是我比较常用,虽然使用到的软件比较多,但制作起来十分方便,再将这些之前,先看看我自己制作的头条短视频(内含字幕,和解说效果)

\n

{!-- PGC_VIDEO:{"status": 0, "vid": "e9f9a25f5a574a058302c4a5595299c2\

绅士说U


你说的这个问题,我以前也是个小白。学习了一段时间,找到了一款语音同步的软件,还是比较好用的。

1:首先在百度搜索“字幕通”并且下载该软件。

2:打开软件,点击右上角的OFF

3:打开软件后,双击左上角黑方块中的白色方块,导入视频

4:导入视频后,点击左上角的麦克风

5:导入视频后,会自动识别语音,出现字幕。字体的颜色,字体都可以设置。

6:有时候,普通话不标准,个别字体识别不了,你可以改写一下。

7:最后点击左边第10个小长方框,导出视频,就可以了

希望我的回答能帮助到你,不懂的地方,关注我,发私信给我。知无不言言无不尽。


早晨的阳光孝字当先


因为自己也在做视频,经常会用到一些软件,这里推荐一个小白就可以操作的字幕软件《字幕通》软件。

刚开始做视频的时候,也听那些所谓专业的老师说用AE来操作,对于一个连大学都没上过的我来说,根本看不懂好吗。或者说那些所谓的自媒体老师自己都不会用AE好吗。

但是没办法,为了赚钱拍视频要陪字幕啊,后来用了爱剪辑快剪辑。自己一个字一个字手打,然后自己对接音轨。累的要死,为了偷懒,开始逛各种论坛,皇天不负有心人,找到了。

会用电脑就能操作,全是中文的

把拍好的视频导入进去,点击语音切轴,然后点击语音识别,一般的方言什么的都能识别出来,自动同步到音轨。

觉得文字样式不好看,还能自己设置,最后导出视频就可以了





分享到:


相關文章: