工作原理

本文目的流程工作原理

使用目的

將Youtube影片內容文字(字幕)全數下載成文字檔案後,再快速翻譯成所需語言(如英文影片的英文字幕想翻成中文)。即把Youtube內的CC字幕下載並快速翻譯成中文,以便轉傳分享他人。

使用前提

  1. 此Youtube影片必須含有CC字幕(何謂Youtube的CC字幕),如此才能使用YouTube 字幕下載器來下載 YouTube 字幕。
  2. 本文不適合未提供字幕(崁入至影片者也不算)之影片,若無字幕仍需轉成文字檔,則須改用語音轉文字之軟體來協助。

常見問題

  1. 明明影片有CC字幕,但使用YouTube 字幕下載器卻無法下載;因為該下載器未適時更新,故會失效或誤判,可改用其他下載器試試!
  2. 有些YouTube 字幕下載器可以線上直接翻譯成其他語言,使用時卻失敗無法翻譯;同上,因為軟體未適時更新結果!網搜所提供免費線上YouTube 字幕下載器,剛開始出現(提供)時的確好用,可是使用過一陣子後會完全失效或部分失效,解決之道就是另覓其他可用字幕下載器!或寫信告知該軟體作者改進!
  3. 字幕下載器產生的文字檔均含有數字或時間戳記及空白列、段落。還必須一一清除再編輯排整,甚耗時間!(PS:含有時間戳記的SRT檔案,只是方便後製再崁入影片當中,若只是想擷取影片演講稿內容,這些帶有數字及時間戳記符號等,就造成困擾)

正確操作流程

  1. 使用在線字幕轉換工具SAVESUBS (適合影片平台:Youtube.Com、Youtu.Be、Dailymotion.Com、Viki.Com、Facebook.Com、Vimeo.Com、Kocowa.Com)
  2. 貼入影片連結➊後,按下載➋
  3. 在跳出畫面右側開啟選項➌,並勾選全部要去除的符號➍,最後選擇副檔名TXT➎來下載
  4. 用記事本文字編輯器開啟此TXT文字檔,並將此TXT文字稿內容全選複製改貼入至WORD文件編輯器內

本文測試影片:https://www.youtube.com/watch?v=bx5jDSJT83E

TXT檔內容轉貼至WORD後畫面
  • 將上述經由字幕轉換工具轉出的TXT文字稿內容,全選複製改貼入至WORD文件編輯器內後的畫面外觀如左。
  • 惟每句文字末尾會產生出段落標記,以及空白列也會產生段落標記。此段落標記無法鍵盤打出。
  • 但至少已經去處原有的數字與時間戳記等大量無關符號。
  • 接著只要使用WORD的替代功能,將此段落符號去除即可。
  • 若直接使用此TXT文字檔丟給GOOGLE翻譯平台,會產生字數或頁面數量上的限制而翻譯不全。
  • 所以必須先將英文稿的段落符號去除,拼接後才有完整英文句子,且省去佔很多頁面空間,如此頁面數量變小後,再丟給GOOGLE翻譯才會迅速有效且完整。

如何去除末尾段落符號

  1. 開啟WORD編輯器後,將TXT內容全選貼入。
  2. 點選WORD面板的取代功能(或按快速鍵Ctrl+H),如下圖。
  3. 跳出尋找及取代視窗後,點選更多按紐/特殊按鈕/選第一個段落標記
  4. 之後會在尋找目標欄位出現(^P),再同樣操作一次,使出現兩個(^P^P),(按:段落符號的WORD系統認定代碼為^P)
  5. 將游標移至取代為之欄位再按步驟7操作,得到一個(^P)
  6. 點選全部取代按紐,即可去除空白列,此為第一次取代之作業目的。
  7. 去除空白列後,只剩下每一句尾的段落符號待清除。

尋找與取代之視窗畫面
去除空白列後剩下每句句尾之段落符號待移除
此為第一次取代作業後之畫面
  • 上述操作步驟先去除空白列,接著剩下每句句尾的段落符號待去除,畫面如左。
  • 接著後續步驟欲移除此句尾段落符號,原理同上,只要在尋找目標欄位改成一個^P,取代為欄位改成一個空白(PS:此欄位完全刪除後,輕按一次空白鍵,有多出一個空白的感覺,是半型的空白,不是全型的空白哦!)
  • 此作法目的是將下一列文字拼接至上一列字尾,使成完整句子,若取代為之欄位沒有鍵入任何半型空白格,則會與上句句尾黏在一起,那英文單字恐怕無法正確辨識,造成翻譯上的錯誤!此為第二次取代之作業目的。
  • 注意:去除空白列要兩個^P^P(尋找目標欄位)及一個^P(取代為欄位);去除句尾的段落符號要一個^P(尋找目標欄位)及一個半型空白格(取代為欄位)
  • 完成此兩個取代作業後,就能得出完整英文字幕存在每一頁面上了!如下圖示意,此時就可以將檔案存成DOCX檔,再上傳此文件至GOOLE翻譯平台做文件翻譯就大功告成!

第二次取代作業後的畫面樣式,已去除全部段落符號並拼接完成

由GOOGLE翻譯中文

將上述完成兩次取代作業後的WORD文字檔存檔(副檔名格式為docx),再於Google的翻譯平台,(如下圖)點選上列文件標籤,再點選來源語言(如英文)及欲翻譯語言(如繁體中文),再上傳此文件,再點選翻譯按紐,數秒後待翻譯完成,再點選下載譯文,即可快速獲得所需語言之檔案!

Google翻譯平台Google 翻譯

後記

  1. 透由GOOGLE所翻譯的文章,在用字遣詞上,部分的確會不順暢、字義也不太清楚、念起來也怪怪的,但基本的主要信息內容架構都在,還是能夠明白該演講所要表達的意義!
  2. 能夠由機器瞬間完成影片內容文字稿下載與翻譯,在效能上已大大減少人力的辛勞,雖然語氣不順、文字不通,但大致能辨出影片所要傳達大義,若時間允許,可再經由人工分段、潤飾、修整及排版文句,那就更完美了!
  3. Youtube本身也有字幕即時翻譯各種語言功能,只要該影片含有CC字幕,直接於Youtube平台就可以點選切換,可以邊觀賞邊看想要字幕,當然文字也不會太通順就是。而本文用意不同的地方在:快速下載並翻譯文字稿,便於轉傳分享他人,使第一時間知悉演講全部大致內容,不用全部看完整部影片!
  4. Youtube本身除了有即時同步翻譯字幕功能,另也有內建的轉錄稿功能,位置在該 YouTube 影片標題下方的工具列上,點選右邊的「⋯」>「顯示轉錄稿」。再在此轉錄稿全選複製後貼於TXT文字編輯器,同樣可以得到想要的字幕檔案,惟每列會多出時間戳記就是,若影片內容很長,檔案佔WORD版面頁面也會很長,太長的檔案給GOOGLE翻譯有時會超出限制而未能完整翻譯,所以看需求來使用,此轉錄稿功能與本文目的未盡相同,故未推薦使用!

參考資料:
1.何謂Youtube的CC字幕?
2.YouTube 字幕下載怎麼用?2 個方法快速下載影片字幕!
3.Word 2016快速刪除空白段落〈空白行〉