テキスト認識
ML Kit のテキスト認識 API を使用すると、ラテン語由来の言語のテキストを認識できます(クラウドベースのテキスト認識を使用すると、より多くの言語のテキストを認識できます)。
テキスト認識はクレジット カードや領収書、名刺の面倒なデータ入力を自動化できます。クラウドベースの API を使用すると、ドキュメントの写真からテキストを抽出することもできます。これにより、アクセシビリティの向上やドキュメントの翻訳を行うことができます。たとえば、列車上の番号を読み取り、アプリで実際の対象物を追跡することもできます。
Flutter デベロッパーの方は、Firebase の ML Vision API 用のプラグインを含む FlutterFire をお試しください。
オンデバイス API と Cloud APIs の比較
オンデバイス | Cloud | |
---|---|---|
料金 | 無料 | 毎月最初の 1,000 回の使用は無料です。詳しくは料金をご覧ください。 |
理想的なユースケース |
リアルタイム処理(カメラや動画のフィードに最適) 画像内のまばらなテキストを認識 |
高精度のテキスト認識 画像内のまばらなテキストを認識 ドキュメントに含まれる画像内で密集したテキストを認識 Cloud Vision API のデモをご覧ください。 |
言語対応 | ラテン文字の認識 | さまざまな言語と特殊文字の認識と識別 |
実行結果の例
まばらなテキスト
認識されたテキスト | |
---|---|
テキスト | Wege |
ブロック | (1 ブロック) |
ブロック 0 | |
---|---|
テキスト | Wege der parlamentarischen Demokratie |
フレーム | (117.0, 258.0, 190.0, 83.0) |
四隅の点 | (117, 270)、(301.64, 258.49)、(306.05, 329.36)、(121.41, 340.86) |
認識された言語コード | de |
線 | (3 本の線) |
線 0 | |
---|---|
テキスト | Wege der |
フレーム | (167.0, 261.0, 91.0, 28.0) |
四隅の点 | (167, 267)、(255.82, 261.46)、(257.19, 283.42)、(168.36, 288.95) |
認識された言語コード | de |
要素 | (2 個の要素) |
要素 0 | |
---|---|
テキスト | Wege |
フレーム | (167.0, 263.0, 59.0, 26.0) |
四隅の点 | (167, 267)、(223.88, 263.45)、(225.25, 285.41)、(168.36, 288.95) |
ドキュメント テキスト
認識されたテキスト | |
---|---|
テキスト |
DR. SEWARD'S DIARY 361
… (全文) |
ブロック | (1 ブロック) |
ブロック 0 | |
---|---|
テキスト |
… (全文) |
信頼度 | 0.98 |
フレーム | (25.0, 21.0, 359.0, 583.0) |
認識された言語コード | en |
段落 | 10 段落 |
段落 1 | |
---|---|
テキスト | " No , " she said quite simply , " it will not be necessary . You can tell them just as well . I must go with you on your journey . " |
信頼度 | 0.98 |
フレーム | (29.0, 110.0, 355.0, 44.0) |
認識された言語コード | en |
単語 | (34 単語) |
単語 7 | |
---|---|
テキスト | simply |
信頼度 | 0.99 |
フレーム | (179.0, 110.0, 37.0, 15.0) |
認識された言語コード | en |
記号 | (6 個の記号) |
記号 0 | |
---|---|
テキスト | s |
信頼度 | 1.00 |
フレーム | (179.0, 110.0, 3.0, 15.0) |
認識された言語コード | en |