皆さんこんにちは、背景商店です。今回は画像内の文章を摘出してくれる便利なサイトを2つ メリットとデメリットを挙げて紹介します。
1. onlineocr.net
このサイトは、PDFおよび画像(JPG、BMP、TIFF、GIF)からテキストを抽出し、編集可能な Word、Excel、およびテキスト出力形式に変換してくれます。
メリット
- 対応する言語が豊富
- 対応する画像の種類、変換することのできる種類が豊富
- 高精度の摘出
- 縦書き対応
デメリット
- 表示言語が英語
- 摘出後ダウンロードしなければならない
- 最大15MB
実際にやってみた結果
元文書⬇️
新型コロナウイルスに感染すると体内にできる「抗体」と同様のたんぱく質を速やかに人工的に作ることに名古屋大学などの研究グループが成功し、細胞への感染を抑えることも確認できたと発表しました。研究グループは、新しい治療薬の開発などに応用できる可能性があるとしています。
抗体を作ることに成功したのは、名古屋大学の村上裕教授と名古屋医療センターの研究グループです。
新型コロナウイルスに感染すると、体内に「抗体」と呼ばれるたんぱく質が作られ、その後、ウイルスが細胞に入り込むのを防ぐとされています。
これまで、抗体を人工的に作るには少なくとも数週間かかっていましたが、研究グループは10兆を超える人工の抗体の中から特定のウイルスに結びつくものを速やかに選び出す「TRAP提示法」という新しい技術を開発し、新型コロナウイルスに対する抗体を4日間で作ることに成功したということです。
また、人工的に作った抗体は新型コロナウイルスだけと非常に強く結合する特徴があり、ウイルスの細胞への感染を抑えることが確認できたということです。
研究グループでは、この抗体を感染の有無を調べる検査や新しい治療薬の開発に応用できる可能性があるとしています。
引用:NHK NEWS WEB
摘出したもの⬇️
新型コロナウイルスに感染すると体内にできる「抗体」と同様のたんばく質を速やかに人工的に作ることに名古屋大学などの研究グループが成功し、細胞への感染を抑えることも確認でたと発表しました。研究グルーブは、新しい治療桑の開発などに応用できる可能性があるとしています。
抗体を作ることに成功したのは、名古屋大学の村上裕教授と名古屋医療センターの研究グループです。
新型コロナウイルスに感染すると、体内に「抗体」と呼ばれるたんぱく質が作られ、その後、ウイルスが細胞に入り込むのを防ぐとされています。
これまで、抗体を人工的に作るには少なくとも数週問かかっていましたが、研究グループは10兆を超える人工の抗休の中から特定のウイルスに結びつくものを連やかに選び出すTRAP提示法」という新しい技術を開発し、新型コロナウイルスに対する抗体を4日問で作ることに成功したということです。
また、人工的に作った抗体は新型コロナウイルスだけと非常に強く結合する特徴がありウイルスの細胞への感染を抑えることが確認できたということです,
研究グループでは、この抗体を感染の有無を調べる検査や新しい治療薬の開発に応用できる可能陛があるとしています。
画像左側がonlineocrで摘出したものです。
「ぱ」が「ば」になってたり、「間」が「問」になっていたり、小学1年生が漢字を書き間違える程度です。507文字中9文字が間違っていました。
その他にも、余分な半角スペースが入っていたり、全角が半角になっていたりはします(上画像では加工済)が、これは間違いというほどのものでもないと思います。
しかし、似た漢字の間違いに気づかずにレポートを作成してしまうと、少し恥ずかしいですね(笑)
2.Googleドキュメント
これは、Googleドキュメントの画像を読み取る機能を利用するやり方のことです。
メリット
- わざわざテキストファイルをダウンロードしなくても良い
- Googleサービスなので安心安全
- 正確性はピカイチ(しかし余計な空白がとても多い)
デメリット
- ドキュメントをわざわざ作成しないといけないので少し面倒
やり方
まずはじめにGoogleDriveにアクセスします。
次に新規→ファイルのアップロードをクリックして、摘出したい画像を選択します。
(またはGoogleDriveウィンドウ内にドラッグ)
アップロードがおわったら、摘出したい画像を選んで右クリック➡️アプリで開く➡️Google ドキュメント の順番でクリック
新規ウィンドウが開かれるのを少し待つと、完璧に摘出されています。
*1 しかし、なぜ僕がこのやり方をトップで紹介しないかと言うと、
実はこれ、
空白が多すぎるんです。
画像では修正していますが、実際は、空白の修正が大変だったんです。
onlineocr.netのように簡単な間違いだと気づくんですが、空白となるとちょっと、、、きついです。
まとめ
画像の文字を摘出には、
onlineocr.netがお勧め!!
スライド等に使うため空白はあまり気にならないよーという人は Google ドキュメント がオススメ!!
0コメント