重要なお知らせ

背景商店は、さらに情報をわかりやすく伝えるため、2021年12月10日に、サーバーを移転しました。

その為、このサイト上の記事は今後更新されません。移転先はこちらです。

( https://haikeisyouten.cf )

画像内の文章を簡単に摘出するサイト!!


皆さんこんにちは、背景商店です。今回は画像内の文章を摘出してくれる便利なサイトを2つ メリットとデメリットを挙げて紹介します。



1. onlineocr.net


このサイトは、PDFおよび画像(JPG、BMP、TIFF、GIF)からテキストを抽出し、編集可能な Word、Excel、およびテキスト出力形式に変換してくれます。


メリット 

  • 対応する言語が豊富
  • 対応する画像の種類、変換することのできる種類が豊富
  • 高精度の摘出
  • 縦書き対応


デメリット

  • 表示言語が英語
  • 摘出後ダウンロードしなければならない
  • 最大15MB


実際にやってみた結果

元文書⬇️

新型コロナウイルスに感染すると体内にできる「抗体」と同様のたんぱく質を速やかに人工的に作ることに名古屋大学などの研究グループが成功し、細胞への感染を抑えることも確認できたと発表しました。研究グループは、新しい治療薬の開発などに応用できる可能性があるとしています。  
抗体を作ることに成功したのは、名古屋大学の村上裕教授と名古屋医療センターの研究グループです。
 新型コロナウイルスに感染すると、体内に「抗体」と呼ばれるたんぱく質が作られ、その後、ウイルスが細胞に入り込むのを防ぐとされています。 
これまで、抗体を人工的に作るには少なくとも数週間かかっていましたが、研究グループは10兆を超える人工の抗体の中から特定のウイルスに結びつくものを速やかに選び出す「TRAP提示法」という新しい技術を開発し、新型コロナウイルスに対する抗体を4日間で作ることに成功したということです。
 また、人工的に作った抗体は新型コロナウイルスだけと非常に強く結合する特徴があり、ウイルスの細胞への感染を抑えることが確認できたということです。 
研究グループでは、この抗体を感染の有無を調べる検査や新しい治療薬の開発に応用できる可能性があるとしています。

引用:NHK NEWS WEB

摘出したもの⬇️

新型コロナウイルスに感染すると体内にできる「抗体」と同様のたんく質を速やかに人工的に作ることに名古屋大学などの研究グループが成功し、細胞への感染を抑えることも確認でたと発表しました。研究グルーは、新しい治療の開発などに応用できる可能性があるとしています。

抗体を作ることに成功したのは、名古屋大学の村上裕教授と名古屋医療センターの研究グループです。

新型コロナウイルスに感染すると、体内に「抗体」と呼ばれるたんぱく質が作られ、その後、ウイルスが細胞に入り込むのを防ぐとされています。

これまで、抗体を人工的に作るには少なくとも数週かかっていましたが、研究グループは10兆を超える人工の抗の中から特定のウイルスに結びつくものをやかに選び出すTRAP提示法」という新しい技術を開発し、新型コロナウイルスに対する抗体を4日で作ることに成功したということです。

また、人工的に作った抗体は新型コロナウイルスだけと非常に強く結合する特徴がありウイルスの細胞への感染を抑えることが確認できたということです

研究グループでは、この抗体を感染の有無を調べる検査や新しい治療薬の開発に応用できる可能陛があるとしています。



画像左側がonlineocrで摘出したものです。

「ぱ」が「ば」になってたり、「間」が「問」になっていたり、小学1年生が漢字を書き間違える程度です。507文字中9文字が間違っていました。

その他にも、余分な半角スペースが入っていたり、全角が半角になっていたりはします(上画像では加工済)が、これは間違いというほどのものでもないと思います。

しかし、似た漢字の間違いに気づかずにレポートを作成してしまうと、少し恥ずかしいですね(笑)





2.Googleドキュメント


これは、Googleドキュメントの画像を読み取る機能を利用するやり方のことです。



メリット

  • わざわざテキストファイルをダウンロードしなくても良い
  • Googleサービスなので安心安全
  • 正確性はピカイチ(しかし余計な空白がとても多い)

デメリット

  • ドキュメントをわざわざ作成しないといけないので少し面倒


やり方

まずはじめにGoogleDriveにアクセスします。

drive.google.com


次に新規→ファイルのアップロードをクリックして、摘出したい画像を選択します。

(またはGoogleDriveウィンドウ内にドラッグ)

アップロードがおわったら、摘出したい画像を選んで右クリック➡️アプリで開く➡️Google ドキュメント の順番でクリック

新規ウィンドウが開かれるのを少し待つと、完璧に摘出されています。



*1 しかし、なぜ僕がこのやり方をトップで紹介しないかと言うと、

実はこれ、

空白が多すぎるんです。

画像では修正していますが、実際は、空白の修正が大変だったんです。

onlineocr.netのように簡単な間違いだと気づくんですが、空白となるとちょっと、、、きついです。




まとめ

画像の文字を摘出には、

onlineocr.netがお勧め!!

スライド等に使うため空白はあまり気にならないよーという人は Google ドキュメント がオススメ!!



背景商店

インターネットや、ゲームなどの衝撃の裏技や困ったときの対処法を転載していく、場所です。

0コメント

  • 1000 / 1000

少しでも面白いと思ってくれたら、フォローをお願いします!

それが明日を生きる活力になります!(笑)

背景商店

良ければフォローよろですインターネットや、ゲームなどの衝撃の裏技や困ったときの対処法を転載していく、場所です。