転写する各ツールは特定のニッチを対象としており、Sonixは会議やプレゼンテーションを記録するツールを選択しており、検索または配布には型付きバージョンが必要です。.
したがって、学生にとってもエグゼクティブにとっても同様に有用であり、将来の参照のために簡単に索引付けできる転写を提供します.
しかし、これらのタスクを成功させるには、ソフトウェアが正確で手頃な価格である必要があります.
Sonix.aiはそのツールであり、オンラインサービスはインストールされたアプリケーションと競合できますか?
- Sonix.aiを試してみませんか?こちらのウェブサイトをご覧ください
(画像クレジット:Sonix)
プランと価格
多くの転記サービスと同様に、Sonixのコストモデルは時間に基づいています。具体的には、処理するサービスにアップロードする記録の長さ、およびそのリソースのコストが1時間あたり10ドルである場合、従量制の標準サービスを使用します.
各ユーザーの月額22ドルでプレミアムサブスクリプションサービスにサインアップすると、1時間あたりのコストは5ドルに下がる可能性があります。また、月単位で100時間を超える表記が必要な企業には、ボリュームディスカウントを利用できます.
標準プランには最も基本的な機能があり、プレミアムにはマルチユーザーアクセスやチーム共有などの追加機能が追加されます。また、Enterpriseには、Premiumが提供するすべてのものがあり、多くの管理機能が追加され、サポートモデルが強化されています。.
トランスクリプションサービスが進むにつれて、Sonixはより高価なものの1つであり、学生やホームユーザーの大部分が合理的に購入できるものではありません。.
(画像クレジット:Sonix)
設計
my.sonix.aiサイトは非常にクリーンなデザインを使用しており、アカウントの作成は無料です.
これを書いている時点では、これはもっぱらウェブベースのサービスであり、Sonixにはオーディオ録音をキャプチャして処理するためのモバイルアプリはありません.
ただし、後ほど説明するように、この問題を回避する簡単な方法があり、モバイルアプリの不足を多少解決します.
転写作業の開始点はSonix.aiダッシュボードです。ここでは、既に転写された音声を確認し、処理する新しい音声を追加できます.
このシステムは複数のユーザー向けに設計されているため、適切と思われる方法で文字起こしを整理する仮想フォルダーシステムが含まれています。.
「アップロード」をクリックすると、ユーザーは複数のファイルをシステムにドロップできるページに移動し、アカウントに十分なクレジットがある場合は処理できます.
wav、mp3、mp4a、aiff、acc、ogg、wmaなど、すべての標準オーディオファイル形式がサポートされており、一部のビデオパッケージ構造をアップロードすることもできます。最大ファイルサイズは4GBです。したがって、大きな4K解像度のビデオファイルをアップロードする前に、他のツールを使用して音声を分割し、アップロードを高速化することをお勧めします.
アップロードを高速化する良い方法は、Googleドライブ、One Drive、Box、Dropboxなどのクラウドストレージ機能を使用して、アカウントに直接リンクすることです。 Webページにファイルをドロップするよりも洗練されたワークフローを作成する手段として、Gmailを使用してシステムにメールを送信することもできます.
この自動化はZapierを介して提供され、それを使用するビジネスがビジネスプロセスを接続するためにそのテクノロジーに投資している場合、はるかに幅広い統合を可能にします。.
もう1つの良い点は、オーディオファイルまたはビデオファイルと共に、既存の文字起こしを含めることができることです。これにより、プロセスをより迅速に完了し、精度を向上させることができます。.
(画像クレジット:Sonix)
もう1つの良い点は、オーディオファイルまたはビデオファイルと共に、既存の文字起こしを含めることができることです。これにより、プロセスをより迅速に完了し、精度を向上させることができます。.
クラウドベースの処理の性質上、処理がどれだけ速いか遅いかを判断することは不可能ですが、Sonix.aiは私たちの経験では比較的速いです。通常、記録が継続するので、転写するのに10%から20%の時間がかかります。したがって、10分間の録音を完了するには通常2分未満かかります.
システムは、作業が完了すると、新しい文字起こしへのリンクとともにメールで通知を送信するため、処理に従う必要はありません。.
ファイルが処理されると、ファイルを編集ページ内で開いて結果を確認できます。また、一部のアプリで字幕として定義されているものなど、さまざまな便利な形式でテキストをエクスポートできます.
システムでサポートされている言語と方言の数は36であり、これには複数の英語、フランス語、広東語、北京語、ポルトガル語、スペイン語を話す国、すべての一般的な西および東ヨーロッパの言語、アジアおよびアラビア語が含まれます.
(画像クレジット:Sonix)
録音
AIが人間が発するノイズを解釈するために必要な作業に加えて、おそらく録音ページはここでの重要なコーディング作業を表します.
ここでは、音声とそれに関連するトランスクリプトの両方を比較し、話者の変更の詳細と誤解の修正を使用して手動で強化できます。.
トランスクリプトを介してテキストを洗練するために作業する人のために、このページには炭鉱の場所が記載されています。使いやすく従うのが非常に簡単なので、この部分にいくらかの努力が注がれていることは理にかなっています.
問題が発生する可能性のある場所をユーザーに指示するために、Sonix.aiは内容に色を付けて、自信のないセクションを強調表示します。この機能は便利ですが、Sonix.aiは、文字起こしが「非常に自信がある」ステータスであると考える部分でも間違いを犯す可能性があります.
このページの最良の側面は、カーソルをテキストに置くと再生位置が同じセクションに移動するように、オーディオ再生とテキストがどのように同期されるかです。.
プレーンな編集に加えて、さまざまなスタイルのセクションを強調表示し、書き起こしと一緒にメモを作成することもできます.
タイムコードを微調整することもできます。特に、録音が長い一時停止または不要なプリアンブルで始まる場合に便利です。.
(画像クレジット:Sonix)
正確さ
SonixはSonix.aiを「最先端のAIを搭載した最高の自動転写ソフトウェア」と説明しています.
テストの結果、この製品は、録音の品質や、簡単に制御できない他の多くの要因に大きく依存していると説明しました.
古典的な歴史的なスピーチの録音を処理するとき、たとえ彼らが私たちにはっきりと聞こえたとしても、それはいくつかのスピーカーでは本当に困難でした.
これらの結果は、精度は許容できるもののほとんど恒星ではない、同時記録とは対照的でした。.
Sonixが採用したアプローチは、スピーカーと録音の品質に応じて、動作するかしないかのいくつかの仮定を行うと結論付けました。.
魅力的なのは、サービスが、言われていることに対する自信に基づいて文字起こしを色分けすることであり、この自己分析は非常に明らかになっています.
状況によっては、セクションが疑わしい可能性があることを正しく識別しますが、他の部分では、それが完全に間違って転写されたセクションを確信しています.
いくつかの一般的な問題は、それを曲線に投げかけているように見えます。これらの1つは、文法的に完璧な散文を話さない人々です。スピーチをより直接的にするために、彼らは文章からいくつかの単語を削除し、より劇的なスタイルを作りました。これらがSonixによって転写されると、実際に話されたものではなく、内部の文法モデルに合うようにそれらの単語を追加することを決定したようです。.
トランスクリプションはドキュメントとして読みやすくなりますが、言われたことを本当に代表するものではありません.
Sonixは、録音の品質とスピーカーの明瞭さが高い場合、確かに優れています。StephenFryの小さなクリップでHarry Potterを読んで証明したように。しかし、常に音質をそのように制御することは不可能であり、それでもそのテストでミスを犯しました。.
別の問題領域は、正式名称と専門用語または略語です。これらはカスタム辞書に追加することで対処できますが、これには名前や頭字語が使用されているときにシステムがより良く認識できるようにするための作業が必要です.
トランスクリプションワードパーフェクトを必要とする人のために、Sonixには録音を通して作業し、それらの問題に対処できる関連するプロのトランスクリプターのセレクションがありますが、これは処理されたトランスクリプションの目的をいくらか無効にします.
(画像クレジット:Sonix)
セキュリティ
Sonix.aiセキュリティの焦点は、音声が処理され、文字起こしが行われるサーバーです.
すべてのトラフィックはTLS(トランスポートレイヤーセキュリティ)を使用して暗号化され、ファイルがファイアウォールの複数のレイヤーで保護されたサーバー上にあると、侵入保護とすべてのデータはAES-256サーバー側の暗号化によって保護されます。また、会社は、従業員が記録または文字起こしにアクセスすることを明示的に許可しない限り、従業員が記録または文字起こしにアクセスできないことを約束します.
このアプローチの重大な問題は、単純なログインとパスワードですべてを回避できることです。 Sonix.aiには2要素認証がなく、ファイルに誰がいつアクセスしたかを簡単にアクセスできるログがありません.
セキュリティの観点から、これはシステムを使用している人々の完全性への過度の依存と見なされる可能性があります。.
つまり、セキュリティを向上させる必要があり、追跡またはユーザーアクティビティの優先度を高くする必要があります.
最終判定
比較的高いコストを考慮すると、Sonixはそれよりも優れたパフォーマンスを期待していました。.
おそらく、トランスコードするものの選択には不運でしたが、それでも途方もない量のエラーが発生するようでした.
この方程式のプラス面は、高速であり、非常に簡単に使用できるシステムですが、サブスクリプションにコミットする前に、このソリューションでいくつかのサンプルレコーディングを実行することをお勧めします.
Sonixの最大の問題はコストが高いことです。特定の要件に適したツールであっても、他の場所で音声をテキストに変換する安価な手段があります。.