1
/
5

Amazon Transcribe:30分の社員インタビューを無料で自動文字起こしをしたので使用感をまとめてみる。

新年、あけましておめでとうございます。今年もよろしくお願いします。
インターンで広報を担当しております、林です。

ダイナミックプラス社でのインターンも5か月目に入りました。早いものです。そのなかで「社員インタビュー」をさせていただく機会がありました。

ここで一つ問題があります。

文字起こしって、めんどくさい

です。自分はインタビュー時の録音を聞きながら文字起こしをしていましたが、これがなかなか時間がかかります。30分のインタビューに対して記事作成は90分ほどかかります。内容を考えながら作れたら作成も楽しいものですが、一度伺った内容の確認である文字起こしはその作業も単調になりがち...

そんな中、弊社データサイエンティストの萩元さんがAmazon Transcribeについて教えてくださいました。

Amazon Transcribeとは?

Amazonが提供する機械学習を使って自動文字起こしをするサービスです。昨年の11月から日本語対応したことから少し話題になっていました。特徴などは下記の記事が分かりやすいです。

Amazon Transcribe:破壊的な文字起こしのスピードと価格。 60分の音声だと150円で、20分もあれば完了。日本語にも対応。|Sangmin Ahn|note
こんにちは、 Choimirai School のサンミンです。 機械学習を使って文字起こしを行なっているサービスはいくつかありますが、 Amazon Transcribe もその一つです。 11月21日から日本語も対象 となりましたので、使い方を簡単に紹介します。 文字起こしの相場が1時間の音声に対して1万円前後。納期も2〜3日かかる。一方で、Amazon Transcribe を使いますと同じ長さの音声を150円で文字起こし出来ます。時間も、20分あれば十分です。 無料で利用できる枠もあって、最初の1
https://note.com/sangmin/n/nf404e9945f48

しかも最初の12か月は、毎月60分の音声データは無料で文字起こしが可能とのこと。これは試すしかない。

ということで。

実際に社員インタビュー記事で試してみた

使い方は簡単3STEPです。ざっくりご説明します。

①Amazon S3に音声データを入れる

下記の記事が参考になります。録音したデータをアップロードします。この時にファイルが存在する場所をメモっておきましょう。

Amazon S3 にファイルをアップロードしてみた
Amazon S3 に特定のディレクトリ以下のファイルのバックアップを送信する手順を紹介します。 ## Amazon S3 の準備 ### バケットの作成 * AWSサービスの「ストレージ」にある「S3」を選択します。 * 「バケットを作成する」のボタンをクリックします。 * 「バケットの作成」画面が開くので「バケット名」を入力して、「次へ」を押します。 * 今回はデフォルトの設定でバケットを作成していきます。 * 最後に下の画像のような画面が出てくるので設定内容を確認したら「バケットを作成」をクリックし
https://hacknote.jp/archives/43864/

②ジョブの作成

Job settings
Name:プロジェクト名を記入しましょう
Language:言語を選択しましょう。今回は日本語を選択しました。
Job queue:よくわからなかったのでスルー。ジョブキューに関しては以下の記事で説明されています。

Amazon Transcribe がバッチワークロードのジョブキューをサポート開始
Amazon Transcribe ...
https://aws.amazon.com/jp/about-aws/whats-new/2019/12/amazon-transcribe-supports-job-queuing-batch-workloads/

Input data
①でS3に入れた音声データファイルの場所を記入します。

Output data
出力するデータの保存先を決めます。Amazon Transcribeが管理するS3バケットか、ユーザー自身のS3バケット化を選択できるそうです。よくわからなかったのでdefaultのままにしました。

上記を埋めNextを選択すると次の画面に移ります。


Audio settings
Audio identification:有効にするとChannel identificationとSpeaker identification が選択でき、前者ではチャネルを識別し、後者では音声内で会話している人数を設定することでTranscribeは話者の変更を認識します。今回はSpeaker identificationを選択し、1対1のインタビューであったのでMaximum number of speakersを2人に設定しました。

Alterantive results:認識結果の複数候補を取得できるそうです。詳しくは以下の記事が参考になります。

Amazon Transcribeで複数の認識候補が取得できるAlternative resultsを試してみた! | Developers.IO
こんにちは、平野です。 Amazon Transcribeを試してみました。 というのも、私は以前(主に日本語の)音声認識システムの研究開発をしていたので、 このサービスは触らなくてはならないものだったのですが、 日本語対応がなかったので尻込みしていました。 ついに日本語対応!ということで、少しずつ触り始めています。 これまでもTranscribeに関するブログはいくつも上がっているので、 ちょっとは新規性をということで、最近追加されたAlternativve results機能を試してみました。 複数の
https://dev.classmethod.jp/cloud/aws/transcribe-alternatrive-results/

Content removal
Vocabualry filtering:特定の用語を自動的に隠したり、削除したりできます。インタビュー記事ですと「えっと」とか「あっ」などの言葉をあらかじめ設定すると便利ですね。

Customization
Custom vocabulary:正しい文字起こしがされにくい分野特有の用語などを設定できます。

とりあえず自分は話者の人数設定だけをしました。ここまで埋めたらあとは実行するだけです!

③待機&結果

お昼を食べに行ったら結果が出ました。

およそ30分ほどのデータでしたが、文字起こしにかかった時間は...
Started:2019/12/2 12:04:41
Ended:2019/12/2 12:10:48
→約6分で完了!!

文字起こしの精度

一番気になるのは文字起こしの精度です。今回はシステムエンジニアの川島さんにインタビューを行いました。

実際に話された内容はこちら

一つは日々の推奨価格を算出していくという我が社の一番の部分と、それともう一つその推奨価格を出すために過去の販売実績というものを集めて、で、これをシステムに取り込んで分析できる状態にするという大きく二つの業務があります

Amazon Transcribeの結果がこちら

一つ は 日々 ひび 水上 価格 を 算出 し て いく と いう 話者 の えーっと 一番 飛ぶ と それと もう 一つ えーっと その 推奨 価格 を、 出す ため に は 過去 の 販売 実績 という もの を 集め て で これ を システム に 取り込ん で 分析 できる 状態 に する という 大きく 二つ の 業務 が あり ます

大体合っています!すごい!

使用感と最後に

ということで今回はAmazon Transcribeを利用してインタビュー記事を書いてみました。
使用感としては思った以上に正確に文字起こしがされていた印象です。
自分は設定をほぼデフォルトのまま行いましたが、より設定を細かくすると精度が高くなるかと思います。
あとは正確に文字を起こす必要がある場面か、または音声を要約するだけで済む場面なのかを考えて使い分けるといいかと思います!

実際にAmazon Transcribeを利用して書いた記事はこちらです!システムエンジニアとしてバリバリご活躍されながら、休日にはバスケをするという若々しさあふれる川島さんの魅力が詰まった記事になっています!

「"新しいものを作っていく"という気持ちが不安を上回っていました」53歳システムエンジニアが描く価格の未来とは | ダイナミックプラス株式会社's post
こんにちは!ダイナミックプラス社(DP社)で広報を担当しています、インターン生の林と申します。「DP社の魅力を発信する」というテーマのもと始まりました社員インタビューも第3弾を迎えました!( 第1弾、 第2弾はこちら!)今回はシステム部でマネージャーをなされている川島さんにお話をお伺いしました。それでは早速参りましょう! ...
https://www.wantedly.com/companies/company_4812749/post_articles/197661

ダイナミックプラス社は現在採用強化中です!幅広いポジションをwantedlyやHPで募集しております!また、弊社に興味を持っていただけたましたら、是非meetupにご参加ください!

Meet up #23 2021.11.26(金) 18:00~

全職種
ざっくりとダイナミックプラス社を知る。meetup#29開催します!
ダイナミックプラス株式会社

こちら、全職種向けのmeetupになります!入退室自由、選考とは無関係、カメラオフで参加できるのでリラックスして参加可能です。どしどしご応募お待ちしております!

公式HP(導入企業やサービスの概要について掲載されています)

ダイナミックプラス株式会社
"価格を科学する"ダイナミックプラス株式会社のウェブサイトです
https://www.dynamic-plus.com

川島さんが所属しているシステム部の募集はこちら!

システムエンジニア
ウェブアプリケーションを通じてAIを世に送りだすシステムエンジニア募集中!
私たちは「スポーツ/エンターテインメント」「ホテル」「リテール」といった全業界にダイナミックプライシングサービスを提供しています。特にスポーツ領域に関しましては、Jリーグ様やプロ野球球団様に導入していただいております。 ダイナミックプライシングとは、市場の需給バランスをもとに適切な価格を算出・提供するサービスです。 ※2020/2/5(水) - 7(金) 第7回 ライブ・エンターテイメント EXPOにて弊社が出展いたします。
ダイナミックプラス株式会社

その他の社員インタビューはこちらから!

「計量経済学の知識を生かし、憧れの業界で価格を扱うのが面白い」ダイナミックプライシングを扱うデータサイエンティストの経歴・業務内容に迫る! | ダイナミックプラス株式会社's post
こんにちは!ダイナミックプラス社(DP社)で広報を担当しております、インターン生の林と申します。 「DP社の魅力を発信する」というテーマ で始まりました社員インタビュー企画。第1弾はデータサイエンティストの萩元さんにお願いしました! (その他の社員インタビューは こちら から!) ...
https://www.wantedly.com/companies/company_4812749/post_articles/197362
ダイナミックプラス株式会社からお誘い
この話題に共感したら、メンバーと話してみませんか?
ダイナミックプラス株式会社では一緒に働く仲間を募集しています
1 いいね!
1 いいね!

同じタグの記事

今週のランキング

林 孝太郎さんにいいねを伝えよう
林 孝太郎さんや会社があなたに興味を持つかも