<?xml version="1.0" encoding="UTF-8"?><rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
	>

<channel>
	<title>画像処理  |  Pythonアカデミア</title>
	<atom:link href="https://arika-blog.com/tag/image-processing/feed/" rel="self" type="application/rss+xml" />
	<link>https://arika-blog.com</link>
	<description>Pythonの基礎が学べる</description>
	<lastBuildDate>Fri, 30 Jan 2026 20:53:21 +0000</lastBuildDate>
	<language>ja</language>
	<sy:updatePeriod>
	hourly	</sy:updatePeriod>
	<sy:updateFrequency>
	1	</sy:updateFrequency>
	<generator>https://wordpress.org/?v=6.9.4</generator>

<image>
	<url>https://arika-blog.com/wp-content/uploads/2022/11/cropped-icon-12-32x32.png</url>
	<title>画像処理  |  Pythonアカデミア</title>
	<link>https://arika-blog.com</link>
	<width>32</width>
	<height>32</height>
</image> 
	<atom:link rel='hub' href='https://arika-blog.com/?pushpress=hub'/>
	<item>
		<title>【AppSheet】カメラ機能をまとめてみた！バーコードやOCRも使える</title>
		<link>https://arika-blog.com/appsheet-camera-function/</link>
					<comments>https://arika-blog.com/appsheet-camera-function/#respond</comments>
		
		<dc:creator><![CDATA[Pythonアカデミア]]></dc:creator>
		<pubDate>Tue, 15 Apr 2025 21:59:17 +0000</pubDate>
				<category><![CDATA[AppSheet]]></category>
		<category><![CDATA[基本操作]]></category>
		<category><![CDATA[画像処理]]></category>
		<guid isPermaLink="false">https://arika-blog.com/?p=4375</guid>

					<description><![CDATA[AppSheetのメリットといえば、「スマホで手軽に使用できる」が挙げられます。また、スマホには（当然ですが）カメラがついており、これは是非活用したいところです。ということで今回はAppSheetのカメラ機能についてまと [&#8230;]]]></description>
										<content:encoded><![CDATA[
<p>AppSheetのメリットといえば、「スマホで手軽に使用できる」が挙げられます。また、スマホには（当然ですが）カメラがついており、これは是非活用したいところです。ということで今回はAppSheetのカメラ機能についてまとめたいと思います。</p>



<!-- START MoshimoAffiliateEasyLink --><script type="text/javascript">(function(b,c,f,g,a,d,e){b.MoshimoAffiliateObject=a;b[a]=b[a]||function(){arguments.currentScript=c.currentScript||c.scripts[c.scripts.length-2];(b[a].q=b[a].q||[]).push(arguments)};c.getElementById(a)||(d=c.createElement(f),d.src=g,d.id=a,e=c.getElementsByTagName("body")[0],e.appendChild(d))})(window,document,"script","//dn.msmstatic.com/site/cardlink/bundle.js?20220329","msmaflink");msmaflink({"n":"手を動かして学ぶ Google AppSheet ノーコード開発入門","b":"シーアンドアール研究所","t":"","d":"https:\/\/m.media-amazon.com","c_p":"","p":["\/images\/I\/51-l0pEb5gL._SL500_.jpg"],"u":{"u":"https:\/\/www.amazon.co.jp\/dp\/4863544723","t":"amazon","r_v":""},"v":"2.1","b_l":[{"id":1,"u_tx":"Amazonで見る","u_bc":"#f79256","u_url":"https:\/\/www.amazon.co.jp\/dp\/4863544723","a_id":3719461,"p_id":170,"pl_id":27060,"pc_id":185,"s_n":"amazon","u_so":0},{"id":2,"u_tx":"楽天市場で見る","u_bc":"#f76956","u_url":"https:\/\/search.rakuten.co.jp\/search\/mall\/%E6%89%8B%E3%82%92%E5%8B%95%E3%81%8B%E3%81%97%E3%81%A6%E5%AD%A6%E3%81%B6%20Google%20AppSheet%20%E3%83%8E%E3%83%BC%E3%82%B3%E3%83%BC%E3%83%89%E9%96%8B%E7%99%BA%E5%85%A5%E9%96%80\/","a_id":3715568,"p_id":54,"pl_id":27059,"pc_id":54,"s_n":"rakuten","u_so":1}],"eid":"cVZBf","s":"l"});</script><div id="msmaflink-cVZBf">リンク</div><!-- MoshimoAffiliateEasyLink END -->



<h2 class="wp-block-heading">Image</h2>



<p>Image型はスマホで写真を撮ることができます。</p>



<figure class="wp-block-image size-full is-resized"><img fetchpriority="high" decoding="async" width="953" height="499" src="https://arika-blog.com/wp-content/uploads/2024/11/67d61d404e227e4e7fdbec269c81914a.png" alt="" class="wp-image-4379" style="width:525px;height:auto" srcset="https://arika-blog.com/wp-content/uploads/2024/11/67d61d404e227e4e7fdbec269c81914a.png 953w, https://arika-blog.com/wp-content/uploads/2024/11/67d61d404e227e4e7fdbec269c81914a-300x157.png 300w, https://arika-blog.com/wp-content/uploads/2024/11/67d61d404e227e4e7fdbec269c81914a-768x402.png 768w" sizes="(max-width: 953px) 100vw, 953px" /></figure>



<p>フォームにカメラアイコンが表示され、タッチするとカメラが起動して写真が撮れます。</p>



<figure class="wp-block-image size-full is-resized"><img decoding="async" width="471" height="620" src="https://arika-blog.com/wp-content/uploads/2024/11/22a06882050a30262d7d73870d2787ff.png" alt="" class="wp-image-4380" style="width:275px;height:auto" srcset="https://arika-blog.com/wp-content/uploads/2024/11/22a06882050a30262d7d73870d2787ff.png 471w, https://arika-blog.com/wp-content/uploads/2024/11/22a06882050a30262d7d73870d2787ff-228x300.png 228w" sizes="(max-width: 471px) 100vw, 471px" /></figure>



<figure class="wp-block-image size-full is-resized"><img decoding="async" width="471" height="618" src="https://arika-blog.com/wp-content/uploads/2024/11/540e8a94c087fb813f68fabd55cd58ec.png" alt="" class="wp-image-4381" style="width:275px" srcset="https://arika-blog.com/wp-content/uploads/2024/11/540e8a94c087fb813f68fabd55cd58ec.png 471w, https://arika-blog.com/wp-content/uploads/2024/11/540e8a94c087fb813f68fabd55cd58ec-229x300.png 229w" sizes="(max-width: 471px) 100vw, 471px" /></figure>



<div class="wp-block-cocoon-blocks-icon-box common-icon-box block-box information-box">
<p>撮った写真はGoogleドライブに保存されます。</p>
</div>



<h3 class="wp-block-heading">Thumbnail</h3>



<p>Thumbnail（サムネイル）という型もあります。違いを調べてみると、画像に比べサイズが小さいとのことです。</p>



<p>画像と同様に写真を撮ることできます。</p>



<div class="wp-block-cocoon-blocks-blogcard blogcard-type bct-none">
<a rel="noopener" href="https://www.googlecloudcommunity.com/gc/AppSheet-Q-A/Thumbnail-vs-Image-I-don-t-understand-the/m-p/377063#M144479" title="Thumbnail vs. Image - I don&#039;t understand the ..." class="blogcard-wrap external-blogcard-wrap a-wrap cf" target="_blank"><div class="blogcard external-blogcard eb-left cf"><div class="blogcard-label external-blogcard-label"><span class="fa"></span></div><figure class="blogcard-thumbnail external-blogcard-thumbnail"><img loading="lazy" decoding="async" src="https://d2yds90mtvelsl.cloudfront.net/original/1X/4b63096fdf36ab74e921ba2fc6e4ad947c0ec431.svg" alt="" class="blogcard-thumb-image external-blogcard-thumb-image" width="160" height="90" /></figure><div class="blogcard-content external-blogcard-content"><div class="blogcard-title external-blogcard-title">Thumbnail vs. Image - I don't understand the ...</div><div class="blogcard-snippet external-blogcard-snippet">Thumbnail vs. Image - I don’t understand the difference between them so far as an Appsheet column config goes. If I have a single Image column, for people to up</div></div><div class="blogcard-footer external-blogcard-footer cf"><div class="blogcard-site external-blogcard-site"><div class="blogcard-favicon external-blogcard-favicon"><img loading="lazy" decoding="async" src="https://www.google.com/s2/favicons?domain=https://discuss.google.dev/t/thumbnail-vs-image-i-dont-understand-the/78002/1" alt="" class="blogcard-favicon-image external-blogcard-favicon-image" width="16" height="16" /></div><div class="blogcard-domain external-blogcard-domain">discuss.google.dev</div></div></div></div></a>
</div>



<h2 class="wp-block-heading">Drawing</h2>



<p>Drawing型はカメラ機能に加えて、撮った写真に対して手書きの情報を追加できます。</p>



<figure class="wp-block-image size-full is-resized"><img loading="lazy" decoding="async" width="967" height="479" src="https://arika-blog.com/wp-content/uploads/2024/11/d15eebf0743679630cae8aea50647e85.png" alt="" class="wp-image-4385" style="width:525px" srcset="https://arika-blog.com/wp-content/uploads/2024/11/d15eebf0743679630cae8aea50647e85.png 967w, https://arika-blog.com/wp-content/uploads/2024/11/d15eebf0743679630cae8aea50647e85-300x149.png 300w, https://arika-blog.com/wp-content/uploads/2024/11/d15eebf0743679630cae8aea50647e85-768x380.png 768w" sizes="auto, (max-width: 967px) 100vw, 967px" /></figure>



<figure class="wp-block-image size-full is-resized"><img loading="lazy" decoding="async" width="468" height="617" src="https://arika-blog.com/wp-content/uploads/2024/11/e223d2a20ad5c8319b5ab730419337a0.png" alt="" class="wp-image-4386" style="width:275px" srcset="https://arika-blog.com/wp-content/uploads/2024/11/e223d2a20ad5c8319b5ab730419337a0.png 468w, https://arika-blog.com/wp-content/uploads/2024/11/e223d2a20ad5c8319b5ab730419337a0-228x300.png 228w" sizes="auto, (max-width: 468px) 100vw, 468px" /></figure>



<p>特定の情報を強調したり、メモを残すことができそうですね。</p>



<h2 class="wp-block-heading">QR(バーコード)読み取り</h2>



<p>SCAN？にチェックを入れると右側にボタン（Open Scanner）が表示されます。</p>



<figure class="wp-block-image size-full is-resized"><img loading="lazy" decoding="async" width="951" height="319" src="https://arika-blog.com/wp-content/uploads/2024/12/0057624c4547c385b917dbc4c71e087c.png" alt="" class="wp-image-4436" style="width:647px;height:auto" srcset="https://arika-blog.com/wp-content/uploads/2024/12/0057624c4547c385b917dbc4c71e087c.png 951w, https://arika-blog.com/wp-content/uploads/2024/12/0057624c4547c385b917dbc4c71e087c-300x101.png 300w, https://arika-blog.com/wp-content/uploads/2024/12/0057624c4547c385b917dbc4c71e087c-768x258.png 768w" sizes="auto, (max-width: 951px) 100vw, 951px" /></figure>



<p>ボタンを押すとカメラが起動し、スキャンすることができます。</p>



<figure class="wp-block-image size-full is-resized"><img loading="lazy" decoding="async" width="300" height="300" src="https://arika-blog.com/wp-content/uploads/2025/04/qr_with_logo.png" alt="" class="wp-image-4437" style="width:196px;height:auto" srcset="https://arika-blog.com/wp-content/uploads/2025/04/qr_with_logo.png 300w, https://arika-blog.com/wp-content/uploads/2025/04/qr_with_logo-150x150.png 150w, https://arika-blog.com/wp-content/uploads/2025/04/qr_with_logo-100x100.png 100w" sizes="auto, (max-width: 300px) 100vw, 300px" /><figcaption class="wp-element-caption">実際に読み取ったQRコード</figcaption></figure>



<figure class="wp-block-image size-full"><img loading="lazy" decoding="async" width="340" height="117" src="https://arika-blog.com/wp-content/uploads/2025/04/a0bae7bab5560f3ff989e652d9044a41.png" alt="" class="wp-image-4438" srcset="https://arika-blog.com/wp-content/uploads/2025/04/a0bae7bab5560f3ff989e652d9044a41.png 340w, https://arika-blog.com/wp-content/uploads/2025/04/a0bae7bab5560f3ff989e652d9044a41-300x103.png 300w" sizes="auto, (max-width: 340px) 100vw, 340px" /></figure>



<h2 class="wp-block-heading">OCR</h2>



<p>OCR（光学的文字認識）とは下の画像のように、手書きや印刷された文字をイメージスキャナやデジタルカメラによって読みとり、コンピュータが利用できるデジタルの文字コードに変換する技術です。</p>



<figure class="wp-block-image aligncenter size-full is-resized"><img loading="lazy" decoding="async" width="640" height="360" src="https://arika-blog.com/wp-content/uploads/2022/04/DATA-1.png" alt="" class="wp-image-628" style="width:412px;height:auto" srcset="https://arika-blog.com/wp-content/uploads/2022/04/DATA-1.png 640w, https://arika-blog.com/wp-content/uploads/2022/04/DATA-1-300x169.png 300w, https://arika-blog.com/wp-content/uploads/2022/04/DATA-1-120x68.png 120w, https://arika-blog.com/wp-content/uploads/2022/04/DATA-1-160x90.png 160w, https://arika-blog.com/wp-content/uploads/2022/04/DATA-1-320x180.png 320w" sizes="auto, (max-width: 640px) 100vw, 640px" /></figure>



<p>AppSheetはこのOCRも使用することができます。</p>



<p>はじめに、列を2つ用意します。</p>



<figure class="wp-block-image size-full is-resized"><img loading="lazy" decoding="async" width="561" height="136" src="https://arika-blog.com/wp-content/uploads/2025/04/6a1314063d5ef6d6581fe31e56e7894a.png" alt="" class="wp-image-4439" style="width:404px;height:auto" srcset="https://arika-blog.com/wp-content/uploads/2025/04/6a1314063d5ef6d6581fe31e56e7894a.png 561w, https://arika-blog.com/wp-content/uploads/2025/04/6a1314063d5ef6d6581fe31e56e7894a-300x73.png 300w" sizes="auto, (max-width: 561px) 100vw, 561px" /></figure>



<p>次に、読み取り結果のINITIAL VALUEに、<strong>OCRTEXT([読み取る画像])</strong>と入力してください。</p>



<figure class="wp-block-image size-full"><img loading="lazy" decoding="async" width="344" height="296" src="https://arika-blog.com/wp-content/uploads/2025/04/dc6f8bddc0d76cc9f891cc387f0d44a4.png" alt="" class="wp-image-4440" srcset="https://arika-blog.com/wp-content/uploads/2025/04/dc6f8bddc0d76cc9f891cc387f0d44a4.png 344w, https://arika-blog.com/wp-content/uploads/2025/04/dc6f8bddc0d76cc9f891cc387f0d44a4-300x258.png 300w" sizes="auto, (max-width: 344px) 100vw, 344px" /></figure>



<p>これで写真を撮ると、読み取り結果が表示されるようになります。</p>



<figure class="wp-block-image size-large is-resized"><img loading="lazy" decoding="async" width="600" height="1024" src="https://arika-blog.com/wp-content/uploads/2025/04/unnamed11-600x1024.jpg" alt="" class="wp-image-4441" style="width:285px;height:auto" srcset="https://arika-blog.com/wp-content/uploads/2025/04/unnamed11-600x1024.jpg 600w, https://arika-blog.com/wp-content/uploads/2025/04/unnamed11-176x300.jpg 176w, https://arika-blog.com/wp-content/uploads/2025/04/unnamed11.jpg 750w" sizes="auto, (max-width: 600px) 100vw, 600px" /></figure>



<h2 class="wp-block-heading">まとめ</h2>



<p>カメラ機能についてまとめました。画像は文字と比べて情報量が多いので、共有の幅が一気に広がりそうですね。</p>



<p>AppSheetはGASが使えるとできることの幅がグッと広がります。<br>基礎を学びたい方は以下の書籍がオススメです。</p>



<div class="wp-block-cocoon-blocks-blogcard blogcard-type bct-none">
<a rel="noopener" href="https://zenn.dev/python_academia/books/2e811e6490dd27" title="【図解】GAS 基礎文法の教科書" class="blogcard-wrap external-blogcard-wrap a-wrap cf" target="_blank"><div class="blogcard external-blogcard eb-left cf"><div class="blogcard-label external-blogcard-label"><span class="fa"></span></div><figure class="blogcard-thumbnail external-blogcard-thumbnail"><img loading="lazy" decoding="async" src="https://arika-blog.com/wp-content/uploads/cocoon-resources/blog-card-cache/10d43819514da63c238cd46a75398779.jpg" alt="" class="blogcard-thumb-image external-blogcard-thumb-image" width="160" height="90" /></figure><div class="blogcard-content external-blogcard-content"><div class="blogcard-title external-blogcard-title">【図解】GAS 基礎文法の教科書</div><div class="blogcard-snippet external-blogcard-snippet">※本書はPythonの書籍ではありませんのでご注意下さい。 GAS(Google Apps Scripts)は、Google社が提供しているプログラミング言語になります。Googleアカウントさえあれば始めることができ、環境構築も不要です。 また、GASは業務効率化の定番言語</div></div><div class="blogcard-footer external-blogcard-footer cf"><div class="blogcard-site external-blogcard-site"><div class="blogcard-favicon external-blogcard-favicon"><img loading="lazy" decoding="async" src="https://www.google.com/s2/favicons?domain=https://zenn.dev/python_academia/books/2e811e6490dd27" alt="" class="blogcard-favicon-image external-blogcard-favicon-image" width="16" height="16" /></div><div class="blogcard-domain external-blogcard-domain">zenn.dev</div></div></div></div></a>
</div>
]]></content:encoded>
					
					<wfw:commentRss>https://arika-blog.com/appsheet-camera-function/feed/</wfw:commentRss>
			<slash:comments>0</slash:comments>
		
		
			</item>
		<item>
		<title>【2024年最新】yolov9をGoogle Colaboratory上で試してみた</title>
		<link>https://arika-blog.com/yolov9/</link>
					<comments>https://arika-blog.com/yolov9/#respond</comments>
		
		<dc:creator><![CDATA[Pythonアカデミア]]></dc:creator>
		<pubDate>Sat, 30 Mar 2024 15:40:21 +0000</pubDate>
				<category><![CDATA[AI]]></category>
		<category><![CDATA[Python]]></category>
		<category><![CDATA[画像処理]]></category>
		<guid isPermaLink="false">https://arika-blog.com/?p=3384</guid>

					<description><![CDATA[2024年２月にyolov9が発表されました。yolov8の発表が2023年1月だったので、約1年ぶりの更新です。本記事ではyolov9を使った物体検出をGoogle Colaboratory上で実装していきます。 関連 [&#8230;]]]></description>
										<content:encoded><![CDATA[
<p>2024年２月にyolov9が発表されました。yolov8の発表が2023年1月だったので、約1年ぶりの更新です。本記事ではyolov9を使った物体検出をGoogle Colaboratory上で実装していきます。</p>



<p><strong>関連記事</strong><br><a href="https://arika-blog.com/yolov8/">【リアルタイムで物体検出】yolov8をanaconda環境でサクッと動かす</a><br></p>



<h2 class="wp-block-heading">yolov9について</h2>



<p>今回発表されたyolov9の精度は以下のようになります。</p>



<figure class="wp-block-image size-large is-resized"><img loading="lazy" decoding="async" width="1024" height="884" src="https://arika-blog.com/wp-content/uploads/2024/03/performance-1024x884.jpg" alt="" class="wp-image-3385" style="width:415px;height:auto" srcset="https://arika-blog.com/wp-content/uploads/2024/03/performance-1024x884.jpg 1024w, https://arika-blog.com/wp-content/uploads/2024/03/performance-300x259.jpg 300w, https://arika-blog.com/wp-content/uploads/2024/03/performance-768x663.jpg 768w, https://arika-blog.com/wp-content/uploads/2024/03/performance.jpg 1092w" sizes="auto, (max-width: 1024px) 100vw, 1024px" /><figcaption class="wp-element-caption"><a href="https://github.com/WongKinYiu/yolov9/blob/main/README.md">https://github.com/WongKinYiu/yolov9/blob/main/README.md</a></figcaption></figure>



<p><a href="https://cocodataset.org/#home">MS COCO</a>とは、Microsoftが提供しているデータセットです。また、AP(Average Precision)とは物体検出の評価指標としてよく使われるもので、100％に近づくほど良いです。つまり、過去に発表されたモデルよりも高いパフォーマンスを示していることが分かります。</p>



<p>またモデルは以下の通りです。</p>



<figure class="wp-block-table"><table><thead><tr><th>Model</th><th>Test Size</th><th>AP<sup>val</sup></th><th>AP<sub>50</sub><sup>val</sup></th><th>AP<sub>75</sub><sup>val</sup></th><th>Param.</th><th>FLOPs</th></tr></thead><tbody><tr><td><strong>YOLOv9-T</strong></td><td>640</td><td><strong>38.3%</strong></td><td><strong>53.1%</strong></td><td><strong>41.3%</strong></td><td><strong>2.0M</strong></td><td><strong>7.7G</strong></td></tr><tr><td><strong>YOLOv9-S</strong></td><td>640</td><td><strong>46.8%</strong></td><td><strong>63.4%</strong></td><td><strong>50.7%</strong></td><td><strong>7.1M</strong></td><td><strong>26.4G</strong></td></tr><tr><td><strong>YOLOv9-M</strong></td><td>640</td><td><strong>51.4%</strong></td><td><strong>68.1%</strong></td><td><strong>56.1%</strong></td><td><strong>20.0M</strong></td><td><strong>76.3G</strong></td></tr><tr><td><strong>YOLOv9-C</strong></td><td>640</td><td><strong>53.0%</strong></td><td><strong>70.2%</strong></td><td><strong>57.8%</strong></td><td><strong>25.3M</strong></td><td><strong>102.1G</strong></td></tr><tr><td><strong>YOLOv9-E</strong></td><td>640</td><td><strong>55.6%</strong></td><td><strong>72.8%</strong></td><td><strong>60.6%</strong></td><td><strong>57.3M</strong></td><td><strong>189.0G</strong></td></tr></tbody></table><figcaption class="wp-element-caption"><a href="https://github.com/WongKinYiu/yolov9/blob/main/README.md">https://github.com/WongKinYiu/yolov9/blob/main/README.md</a></figcaption></figure>



<p><a href="https://arxiv.org/abs/2402.13616">yolov9の論文</a>はarXivに公開されています。</p>



<blockquote class="wp-block-quote is-layout-flow wp-block-quote-is-layout-flow">
<p><strong>arXiv</strong>（アーカイヴ、archiveと同じ発音）は、<a href="https://ja.wikipedia.org/wiki/%E7%89%A9%E7%90%86%E5%AD%A6">物理学</a>、<a href="https://ja.wikipedia.org/wiki/%E6%95%B0%E5%AD%A6">数学</a>、<a href="https://ja.wikipedia.org/wiki/%E8%A8%88%E7%AE%97%E6%A9%9F%E7%A7%91%E5%AD%A6">計算機科学</a>、<a href="https://ja.wikipedia.org/w/index.php?title=%E6%95%B0%E9%87%8F%E7%94%9F%E7%89%A9%E5%AD%A6&amp;action=edit&amp;redlink=1">数量生物学</a>（<a href="https://en.wikipedia.org/wiki/Quantitative_biology">英語版</a>）、数量<a href="https://ja.wikipedia.org/wiki/%E3%83%95%E3%82%A1%E3%82%A4%E3%83%8A%E3%83%B3%E3%82%B9">ファイナンス</a>、<a href="https://ja.wikipedia.org/wiki/%E7%B5%B1%E8%A8%88%E5%AD%A6">統計学</a>、<a href="https://ja.wikipedia.org/wiki/%E9%9B%BB%E5%AD%90%E5%B7%A5%E5%AD%A6">電子工学</a>・<a href="https://ja.wikipedia.org/wiki/%E3%82%B7%E3%82%B9%E3%83%86%E3%83%A0%E7%A7%91%E5%AD%A6">システム科学</a>、<a href="https://ja.wikipedia.org/wiki/%E7%B5%8C%E6%B8%88%E5%AD%A6">経済学</a>の、<a href="https://ja.wikipedia.org/wiki/%E3%83%97%E3%83%AC%E3%83%97%E3%83%AA%E3%83%B3%E3%83%88">プレプリント</a>を含む様々な<a href="https://ja.wikipedia.org/wiki/%E8%AB%96%E6%96%87">論文</a>が保存・公開されているウェブサイトである。</p>
<cite>引用：<a href="https://ja.wikipedia.org/wiki/ArXiv">Wikipedia</a></cite></blockquote>



<h2 class="wp-block-heading">yolov9を使ってみる</h2>



<p>Google Colaboratory上でyolov9を使ってみます。</p>



<p><strong>関連記事</strong><br><a href="https://zenn.dev/python_academia/books/6df147d8b82939/viewer/93a9d5">Pythonを簡単に始めよう（Google Colabratory）</a></p>



<p>ランタイムをGPUに変更します。</p>



<figure class="wp-block-image size-large is-resized"><img loading="lazy" decoding="async" width="1024" height="538" src="https://arika-blog.com/wp-content/uploads/2024/04/119591db1dc3c8217c33e55e856e9ab7-1024x538.png" alt="" class="wp-image-3775" style="width:609px;height:auto" srcset="https://arika-blog.com/wp-content/uploads/2024/04/119591db1dc3c8217c33e55e856e9ab7-1024x538.png 1024w, https://arika-blog.com/wp-content/uploads/2024/04/119591db1dc3c8217c33e55e856e9ab7-300x158.png 300w, https://arika-blog.com/wp-content/uploads/2024/04/119591db1dc3c8217c33e55e856e9ab7-768x403.png 768w, https://arika-blog.com/wp-content/uploads/2024/04/119591db1dc3c8217c33e55e856e9ab7.png 1200w" sizes="auto, (max-width: 1024px) 100vw, 1024px" /></figure>



<figure class="wp-block-image size-full is-resized"><img loading="lazy" decoding="async" width="621" height="470" src="https://arika-blog.com/wp-content/uploads/2024/04/ef2c491c65de7097b446c9a824f42959.png" alt="" class="wp-image-3774" style="width:411px;height:auto" srcset="https://arika-blog.com/wp-content/uploads/2024/04/ef2c491c65de7097b446c9a824f42959.png 621w, https://arika-blog.com/wp-content/uploads/2024/04/ef2c491c65de7097b446c9a824f42959-300x227.png 300w" sizes="auto, (max-width: 621px) 100vw, 621px" /></figure>



<p>コードは以下の通りです。</p>



<script src="https://gist.github.com/arika-python/cf4696e2683e2eee2e1467f6f4e3f437.js"></script>



<div class="wp-block-cocoon-blocks-balloon-ex-box-1 speech-wrap sb-id-11 sbs-flat sbp-l sbis-sn cf block-box"><div class="speech-person"><figure class="speech-icon"><img decoding="async" src="https://arika-blog.com/wp-content/uploads/2025/11/icon-1-1-1.png" alt="" class="speech-icon-image"/></figure><div class="speech-name"></div></div><div class="speech-balloon">
<p>先頭に<strong>！</strong>をつけるとshellのコマンドを実行できます。</p>
</div></div>



<p><strong>2023年3月時点、yolov9/utils/general.pyの903行目prediction = prediction[0]をprediction = prediction[0][1]とする必要があります。</strong></p>



<p>詳しくは<a href="https://github.com/WongKinYiu/yolov9/issues/11">Issues</a>をご確認ください。</p>



<p>たったの５行で物体検出ができました。</p>



<figure class="wp-block-image size-full"><img loading="lazy" decoding="async" width="773" height="512" src="https://arika-blog.com/wp-content/uploads/2024/03/3afa32b6-86ec-41bd-a28c-8ae3c9131d4a.jpg" alt="" class="wp-image-3762" srcset="https://arika-blog.com/wp-content/uploads/2024/03/3afa32b6-86ec-41bd-a28c-8ae3c9131d4a.jpg 773w, https://arika-blog.com/wp-content/uploads/2024/03/3afa32b6-86ec-41bd-a28c-8ae3c9131d4a-300x199.jpg 300w, https://arika-blog.com/wp-content/uploads/2024/03/3afa32b6-86ec-41bd-a28c-8ae3c9131d4a-768x509.jpg 768w" sizes="auto, (max-width: 773px) 100vw, 773px" /></figure>



<h2 class="wp-block-heading">まとめ</h2>



<p>yolov9を使って物体検出を行いました。Google Colaboratoryを使うと簡単に実装できるので興味のある方は是非お試しください。</p>



<p class="has-text-align-center">【<strong>図解】Python 基礎文法の教科書を執筆しました！</strong></p>



<p>本書は、これからPythonを学ぶ方や初学者の方でも無理なく勉強を進められるように、図解や画像を豊富に使って説明をしています。</p>



<p>内容はPythonチュートリアル（公式のドキュメント）に準拠しているため、理解必須の部分をこの1冊ですべて網羅することができます。</p>



<p>・エンジニアを目指したい<br>・プログラミングを1から習得したい<br>・リスキリングしてスキルアップしたい</p>



<p class="has-text-align-center">そんな方は是非ご活用ください。</p>



<div class="wp-block-cocoon-blocks-blogcard blogcard-type bct-none">
<a rel="noopener" href="https://zenn.dev/python_academia/books/6df147d8b82939" title="【図解】Python 基礎文法の教科書" class="blogcard-wrap external-blogcard-wrap a-wrap cf" target="_blank"><div class="blogcard external-blogcard eb-left cf"><div class="blogcard-label external-blogcard-label"><span class="fa"></span></div><figure class="blogcard-thumbnail external-blogcard-thumbnail"><img loading="lazy" decoding="async" src="https://arika-blog.com/wp-content/uploads/cocoon-resources/blog-card-cache/207d1bc4f416570dfed7731b6853821e.jpg" alt="" class="blogcard-thumb-image external-blogcard-thumb-image" width="160" height="90" /></figure><div class="blogcard-content external-blogcard-content"><div class="blogcard-title external-blogcard-title">【図解】Python 基礎文法の教科書</div><div class="blogcard-snippet external-blogcard-snippet">本書は、これからPythonを学ぶ方や初学者の方でも無理なく勉強を進められるように、図解や画像を豊富に使って説明をしています。 内容はPythonチュートリアル（公式のドキュメント）に準拠しているため、理解必須の部分をこの1冊ですべて網羅することができます。 ・プログラミング</div></div><div class="blogcard-footer external-blogcard-footer cf"><div class="blogcard-site external-blogcard-site"><div class="blogcard-favicon external-blogcard-favicon"><img loading="lazy" decoding="async" src="https://www.google.com/s2/favicons?domain=https://zenn.dev/python_academia/books/6df147d8b82939" alt="" class="blogcard-favicon-image external-blogcard-favicon-image" width="16" height="16" /></div><div class="blogcard-domain external-blogcard-domain">zenn.dev</div></div></div></div></a>
</div>
]]></content:encoded>
					
					<wfw:commentRss>https://arika-blog.com/yolov9/feed/</wfw:commentRss>
			<slash:comments>0</slash:comments>
		
		
			</item>
		<item>
		<title>【Tesseract OCR】PythonでPDFの文字が抽出できる</title>
		<link>https://arika-blog.com/automation/</link>
					<comments>https://arika-blog.com/automation/#respond</comments>
		
		<dc:creator><![CDATA[Pythonアカデミア]]></dc:creator>
		<pubDate>Sat, 26 Feb 2022 10:31:18 +0000</pubDate>
				<category><![CDATA[Python]]></category>
		<category><![CDATA[業務効率化]]></category>
		<category><![CDATA[画像処理]]></category>
		<guid isPermaLink="false">https://arika-blog.com/?p=128</guid>

					<description><![CDATA[本記事は以下の動画で必要なTesseract・poppler・7zipのダウンロード方法について解説します。 サンプルPDF サンプルコード 動画の内容はPythonとTesseract OCRを使って、PDF（スキャン [&#8230;]]]></description>
										<content:encoded><![CDATA[
<p>本記事は以下の動画で必要なTesseract・poppler・7zipのダウンロード方法について解説します。</p>



<figure class="wp-block-embed aligncenter is-type-video is-provider-youtube wp-block-embed-youtube wp-embed-aspect-16-9 wp-has-aspect-ratio"><div class="wp-block-embed__wrapper">
<iframe loading="lazy" title="【業務効率化実演】PythonでOCRを使ってPDFファイルを一括リネームしてみた" width="1256" height="707" src="https://www.youtube.com/embed/hVAMm_QNPP8?feature=oembed" frameborder="0" allow="accelerometer; autoplay; clipboard-write; encrypted-media; gyroscope; picture-in-picture; web-share" referrerpolicy="strict-origin-when-cross-origin" allowfullscreen></iframe>
</div></figure>



<p><a href="https://arika-blog.com/wp-content/uploads/2023/04/sample.pdf">サンプルPDF</a></p>



<p><a href="https://arika-blog.com/wp-content/uploads/2023/04/tesseract_ocr-1.ipynb">サンプルコード</a></p>



<p>動画の内容はPythonとTesseract OCRを使って、PDF（スキャンデータ）から会社名を抽出し、その値を利用して会社ごとのPDFファイルを作成するという内容になっています。</p>



<p>OCR（光学的文字認識）とは下の画像のように、手書きや印刷された文字をイメージスキャナやデジタルカメラによって読みとり、コンピュータが利用できるデジタルの文字コードに変換する技術です。</p>



<figure class="wp-block-image aligncenter size-full is-resized"><img loading="lazy" decoding="async" width="640" height="360" src="https://arika-blog.com/wp-content/uploads/2022/04/DATA-1.png" alt="" class="wp-image-628" style="aspect-ratio:416/234" srcset="https://arika-blog.com/wp-content/uploads/2022/04/DATA-1.png 640w, https://arika-blog.com/wp-content/uploads/2022/04/DATA-1-300x169.png 300w, https://arika-blog.com/wp-content/uploads/2022/04/DATA-1-120x68.png 120w, https://arika-blog.com/wp-content/uploads/2022/04/DATA-1-160x90.png 160w, https://arika-blog.com/wp-content/uploads/2022/04/DATA-1-320x180.png 320w" sizes="auto, (max-width: 640px) 100vw, 640px" /></figure>



<p>PythonはTesseractというOCRエンジンを使うことができるため、これを用いて資料の文字データを抽出します。（Tesseractは無料で使用することができます。）</p>



<h2 class="wp-block-heading">Tesseractのインストール</h2>



<p>まず始めにTesseractをダウンロードします。<br><a rel="noopener" href="https://github.com/UB-Mannheim/tesseract/wiki" target="_blank">https://github.com/UB-Mannheim/tesseract/wiki</a></p>



<p>お使いのパソコンによって32bitまたは64bit版をダウンロードしてください。</p>



<figure class="wp-block-image"><img decoding="async" src="https://api.axross-recipe.com/attachments/530d7cc2-286e-4a4e-979e-e7e3f1b64f45/url" alt=""/></figure>



<p>言語を選択して次に進みます。</p>



<figure class="wp-block-image"><img decoding="async" src="https://api.axross-recipe.com/attachments/5f433c77-29d6-434c-9abe-1f343b8cf4c2/url" alt=""/></figure>



<p>次へ。</p>



<figure class="wp-block-image"><img decoding="async" src="https://api.axross-recipe.com/attachments/37fab402-19aa-4c1f-89e9-a34e19777ee0/url" alt=""/></figure>



<p>ライセンスを確認して次へ。</p>



<figure class="wp-block-image"><img decoding="async" src="https://api.axross-recipe.com/attachments/c6767fbb-bbd3-43a0-827b-69a321605053/url" alt=""/></figure>



<p>今回は自分しか使わないので、Install just for meを選択します。</p>



<figure class="wp-block-image"><img decoding="async" src="https://api.axross-recipe.com/attachments/e73e85d3-6c4f-48e5-bfdc-aa9e73b534b9/url" alt=""/></figure>



<p>Additional script dataを展開します。</p>



<figure class="wp-block-image"><img decoding="async" src="https://api.axross-recipe.com/attachments/84265592-18ca-4075-a424-32ff4fd93f3a/url" alt=""/></figure>



<p>２つにチェックを入れます。</p>



<figure class="wp-block-image"><img decoding="async" src="https://api.axross-recipe.com/attachments/26d09514-bdd7-4ee5-ad43-1b2e93a0a494/url" alt=""/></figure>



<p>次に、Additional language dataを展開します。</p>



<figure class="wp-block-image"><img decoding="async" src="https://api.axross-recipe.com/attachments/3eba28da-f50d-409a-a415-678cd9707b57/url" alt=""/></figure>



<p>２つにチェックを入れて次に進みます。</p>



<figure class="wp-block-image"><img decoding="async" src="https://api.axross-recipe.com/attachments/d0ea3319-048b-4dc5-87e4-8bc2245ce45e/url" alt=""/></figure>



<p>インストールする場所を選択します。</p>



<figure class="wp-block-image"><img decoding="async" src="https://api.axross-recipe.com/attachments/195d74d2-e407-4934-900f-1398c721f929/url" alt=""/></figure>



<p>そのままインストールを選択します。</p>



<figure class="wp-block-image"><img decoding="async" src="https://api.axross-recipe.com/attachments/0faf0e68-80b6-4715-ad8a-a32341320410/url" alt=""/></figure>



<p>インストールが開始されます。<br>終了したら次に進みます。</p>



<figure class="wp-block-image"><img decoding="async" src="https://api.axross-recipe.com/attachments/c9826655-e0c3-4e6b-ad21-0d930f6f3e09/url" alt=""/></figure>



<p>これでTesseractのインストールが完了です。</p>



<figure class="wp-block-image"><img decoding="async" src="https://api.axross-recipe.com/attachments/cf7ea184-88ae-456b-8ad8-a38aa225288e/url" alt=""/></figure>



<h2 class="wp-block-heading">popplerのインストール</h2>



<p><strong>TesseractはPDFを文字認識することができないため、PDFファイルを一度画像ファイルに変換します。（最後にPDFファイルに戻す。）</strong></p>



<p>画像の変換にはpdf2imageを使用しますが、popplerというコマンドラインツールをインストールする必要があります。</p>



<p>現在、popplerがダウンロードできたサイトが閉鎖されています。（代替案の執筆は少々お待ちください。）</p>



<p>任意のpopplerダウンロードします。</p>



<figure class="wp-block-image"><img decoding="async" src="https://api.axross-recipe.com/attachments/17f53f53-1351-467c-ac04-eedfc0d27d72/url" alt=""/></figure>



<p>zip形式で圧縮されているため、解凍してください。</p>



<p>7zipというソフトを使って解凍することができます。<br><a href="https://sevenzip.osdn.jp/download.html">https://sevenzip.osdn.jp/download.html</a></p>



<figure class="wp-block-image aligncenter size-large is-resized"><img loading="lazy" decoding="async" width="1024" height="334" src="https://arika-blog.com/wp-content/uploads/2023/03/Tesseract-2023-03-13T064825.220-1-1024x334.png" alt="" class="wp-image-2613" style="aspect-ratio:840/273" srcset="https://arika-blog.com/wp-content/uploads/2023/03/Tesseract-2023-03-13T064825.220-1-1024x334.png 1024w, https://arika-blog.com/wp-content/uploads/2023/03/Tesseract-2023-03-13T064825.220-1-300x98.png 300w, https://arika-blog.com/wp-content/uploads/2023/03/Tesseract-2023-03-13T064825.220-1-768x250.png 768w, https://arika-blog.com/wp-content/uploads/2023/03/Tesseract-2023-03-13T064825.220-1.png 1200w" sizes="auto, (max-width: 1024px) 100vw, 1024px" /></figure>



<p>ダウンロードが完了すると、ファイルを右クリックで7z形式の解凍ができるようになっています。</p>



<figure class="wp-block-image aligncenter size-large"><img loading="lazy" decoding="async" width="1024" height="427" src="https://arika-blog.com/wp-content/uploads/2023/03/Tesseract-2023-03-13T211301.375-1024x427.png" alt="" class="wp-image-2618" srcset="https://arika-blog.com/wp-content/uploads/2023/03/Tesseract-2023-03-13T211301.375-1024x427.png 1024w, https://arika-blog.com/wp-content/uploads/2023/03/Tesseract-2023-03-13T211301.375-300x125.png 300w, https://arika-blog.com/wp-content/uploads/2023/03/Tesseract-2023-03-13T211301.375-768x320.png 768w, https://arika-blog.com/wp-content/uploads/2023/03/Tesseract-2023-03-13T211301.375.png 1200w" sizes="auto, (max-width: 1024px) 100vw, 1024px" /></figure>



<p><br>解凍すると４つのファイルがあります。</p>



<figure class="wp-block-image aligncenter size-large"><img loading="lazy" decoding="async" width="1024" height="228" src="https://arika-blog.com/wp-content/uploads/2023/03/244433405562b3210e471526f152ba12-1024x228.png" alt="" class="wp-image-2619" srcset="https://arika-blog.com/wp-content/uploads/2023/03/244433405562b3210e471526f152ba12-1024x228.png 1024w, https://arika-blog.com/wp-content/uploads/2023/03/244433405562b3210e471526f152ba12-300x67.png 300w, https://arika-blog.com/wp-content/uploads/2023/03/244433405562b3210e471526f152ba12-768x171.png 768w, https://arika-blog.com/wp-content/uploads/2023/03/244433405562b3210e471526f152ba12.png 1200w" sizes="auto, (max-width: 1024px) 100vw, 1024px" /></figure>



<p>ディレクトリ（フォルダ）構造が下記になるように移動します。</p>



<figure class="wp-block-image"><img decoding="async" src="https://api.axross-recipe.com/attachments/14261a58-d245-4237-a269-035933daa8af/url" alt=""/></figure>



<p>これでpopplerのインストールが完了です。</p>



<h2 class="wp-block-heading">おわりに</h2>



<p>Pythonを使った社内DXの一例を紹介しました。<br>他にできることはこちらの動画にまとめていますので、興味のある方は是非ご確認ください。</p>



<figure class="wp-block-embed is-type-video is-provider-youtube wp-block-embed-youtube wp-embed-aspect-16-9 wp-has-aspect-ratio"><div class="wp-block-embed__wrapper">
<iframe loading="lazy" title="【初学者向け】Pythonで業務効率化・社内DXできることを分野別6選でまとめてみた" width="1256" height="707" src="https://www.youtube.com/embed/HdYNuhhhcQA?feature=oembed" frameborder="0" allow="accelerometer; autoplay; clipboard-write; encrypted-media; gyroscope; picture-in-picture; web-share" referrerpolicy="strict-origin-when-cross-origin" allowfullscreen></iframe>
</div></figure>



<p><strong>関連記事</strong><br><a href="https://arika-blog.com/python-pdf-compression/">【Python】Ghostscriptを使ってPDFファイルを簡単に圧縮する方法</a></p>



<p class="has-text-align-center"><strong>Python 基礎文法の教科書を執筆しました！</strong></p>



<div class="wp-block-cocoon-blocks-blogcard blogcard-type bct-none">
<a rel="noopener" href="https://zenn.dev/python_academia/books/6df147d8b82939" title="【図解】Python 基礎文法の教科書" class="blogcard-wrap external-blogcard-wrap a-wrap cf" target="_blank"><div class="blogcard external-blogcard eb-left cf"><div class="blogcard-label external-blogcard-label"><span class="fa"></span></div><figure class="blogcard-thumbnail external-blogcard-thumbnail"><img loading="lazy" decoding="async" src="https://arika-blog.com/wp-content/uploads/cocoon-resources/blog-card-cache/207d1bc4f416570dfed7731b6853821e.jpg" alt="" class="blogcard-thumb-image external-blogcard-thumb-image" width="160" height="90" /></figure><div class="blogcard-content external-blogcard-content"><div class="blogcard-title external-blogcard-title">【図解】Python 基礎文法の教科書</div><div class="blogcard-snippet external-blogcard-snippet">本書は、これからPythonを学ぶ方や初学者の方でも無理なく勉強を進められるように、図解や画像を豊富に使って説明をしています。 内容はPythonチュートリアル（公式のドキュメント）に準拠しているため、理解必須の部分をこの1冊ですべて網羅することができます。 ・プログラミング</div></div><div class="blogcard-footer external-blogcard-footer cf"><div class="blogcard-site external-blogcard-site"><div class="blogcard-favicon external-blogcard-favicon"><img loading="lazy" decoding="async" src="https://www.google.com/s2/favicons?domain=https://zenn.dev/python_academia/books/6df147d8b82939" alt="" class="blogcard-favicon-image external-blogcard-favicon-image" width="16" height="16" /></div><div class="blogcard-domain external-blogcard-domain">zenn.dev</div></div></div></div></a>
</div>
]]></content:encoded>
					
					<wfw:commentRss>https://arika-blog.com/automation/feed/</wfw:commentRss>
			<slash:comments>0</slash:comments>
		
		
			</item>
	</channel>
</rss>
