【業務効率化への第一歩】PythonでPDFファイルを自由自在に操る!基礎マスターコース

PythonでPDFを操る代表的なライブラリ(ReportLab・wkhtmltopdf / pdfkit・PyPDF2・pdfminer.six・tabula-py)の基本操作を完全収録!ビジネスシーンの生産性向上に貢献しよう!

4.25 (47 reviews)
Udemy
platform
日本語
language
Other
category
593
students
4.5 hours
content
Jan 2022
last update
$44.99
regular price

What you will learn

Pythonを用いたPDFファイルの基本操作(新規作成・編集・テキストや表抽出)が学べます

ReportLabの基本的な使い方が学べます

pdfkitの基本的な使い方が学べます

PyPDF2の基本的な使い方が学べます

pdfminer. sixを用いたPDF内の日本語テキスト抽出方法が学べます

tabula-pyを用いたPDF内の表の抽出方法が学べます

pyinstallerを用いたPythonプログラムの実行ファイル(exeファイル)化の方法が学べます

Description

ビジネスの現場においてWordやExcelと並んでよく使われるPDFフォーマット


頻繁に用いられるこのPDFフォーマットですが、取扱いが非常に厄介な面もあります。


・社内文書フォーマットがPDFで管理されているが、そこに何か情報を追加したい

・文字をコピーしてもWordやExcelに上手く貼り付けが出来ない

・表にいたってはもはや諦めて手入力で内容を転記する


こういった場面に出くわしたことはありませんか?


私が昔勤めていた会社では、PDF形式の書類テンプレートに手書きで必要事項を記入しそれをスキャナーでスキャンし、更にその電子データをメールで総務の人に送るといった非常に面倒な作業をやっていたことがあります。


今は昔に比べてデジタル化が進んでいますが、それでもまだこういった作業をされている現場は少なくないと思います。


もちろん便利な帳票ツールなどを使うことでその労力を減らすことは出来ますが、高機能な帳票ツールを使うためにはそれなりにコストがかかるのも事実です。


PythonにはPDFファイルを取り扱うことが出来る便利なライブラリが豊富に用意されています。



□講座の特徴

この講座ではPythonにおけるPDFファイル操作を行えるライブラリ(ReportLab・wkhtmltopdf / pdfkit・PyPDF2・pdfminer.six・tabula-py)の基本操作をマスターすることにフォーカスした講座です。


  • Pythonの基礎は学んだが次に何をすれば良いかまだ決まっていない

  • 普段の業務で発生しているPDFファイルのルーチン作業を効率化したい人

  • 市販の帳票ツールは高額である事が多いため、自分でPDF操作可能なツールを開発することに興味がある

  • 自分で作ったPythonプログラムをエンジニアではない他の人や社員に配布して使ってもらいたい人


上記に当てはまる方はこの講座に向いていると思います。


この講座で学ぶ内容を上手く使うことで普段の面倒なPDF操作の作業を少しでも楽に出来るようになり、そして職場の生産性向上につなげていただけると幸いです。

Content

紹介

コースの紹介

環境構築

Anacondaについて
Anacondaの導入(Win)
Anacondaの導入(Mac)
VSCodeについて
VSCodeの導入(Win)
VSCodeの導入(Mac)
Anacondaで仮想環境を作る
VSCodeにおけるPython実行環境の設定
この講座で使った各ライブラリのバージョン情報

PDFファイルの作成

ReportLabの概要
ReportLabのインストール
ReportLabの基本操作(PDFファイルの新規作成)
ReportLabの基本操作(ページサイズの指定)
ReportLabの基本操作(文字の書き込み)
ReportLabの基本操作(画像の挿入)
ReportLabの基本操作(線の描画)
ReportLabの基本操作(図形の描画)
ReportLabの基本操作(改ページ)
ReportLabの基本操作(表の作成)

PDFファイルの作成(実践)で使ったソースコード

PDFファイルの作成(実践)で使ったソースコード

PDFファイルの作成(実践)

実践(ReportLabで書類テンプレートの作成:ステップ1)
実践(ReportLabで書類テンプレートの作成:ステップ2)
実践(ReportLabで書類テンプレートの作成:ステップ3)
実践(ReportLabで書類テンプレートの作成:ステップ4)

Web(HTML)ページをPDFファイル化

wkhtmltopdfとpdfkitの概要
wkhtmltopdfのダウンロードとインストール, Pathの設定(Win)
wkhtmltopdfのダウンロードとインストール(Mac)
pdfkitのインストールとインポート
実践(WebページをPDFファイル化してみよう)

PDFファイルの編集

PyPDF2の概要
PyPDF2のインストールとインポート
PyPDF2の基本操作(ファイルの連結)
PyPDF2の基本操作(ファイルの途中挿入)
PyPDF2の基本操作(ファイルの合成)
PyPDF2の基本操作(ファイルの分割)
PyPDF2の基本操作(ページの回転)
実践(ReportLabと組み合わせて既存PDFに文字を書き込む)

PDFファイル内のテキスト抽出

PDF内のテキストや表を抽出する際の根本的な考え方
PyPDF2による英数字抽出
pdfminer.sixの概要
pdfminer.sixのインストールとインポート
pdfminer.sixで日本語抽出

PDFファイル内の表抽出

tabula-pyの概要
PandasとPandasにおけるデータ形式の概要
Javaのダウンロードとインストール(Win)
Javaのダウンロードとインストール(Mac)
tabula-pyのインストールとインポート
tabula-pyによるPDFファイル内の表抽出
実践(pdfminer.sixとtabula-pyを組み合わせて表抽出・CSV出力)
このセクションでアクセスしたサイトのURL

Pythonプログラムをexe化

Pythonプログラムをexe化するメリット
pyinstallerの概要
pyinstallerのインストール
Pythonプログラムをexe化して動かす

まとめ

まとめ

ボーナスレクチャー

ボーナスレクチャー

Screenshots

【業務効率化への第一歩】PythonでPDFファイルを自由自在に操る!基礎マスターコース - Screenshot_01【業務効率化への第一歩】PythonでPDFファイルを自由自在に操る!基礎マスターコース - Screenshot_02【業務効率化への第一歩】PythonでPDFファイルを自由自在に操る!基礎マスターコース - Screenshot_03【業務効率化への第一歩】PythonでPDFファイルを自由自在に操る!基礎マスターコース - Screenshot_04

Reviews

May 20, 2023
説明はわかりやすかったですが、だいぶPYTHONのバージョンが変わっていたせいなのか、エラーが出ることが多くコードを修正する必要があることが結構ありました。※ある意味、勉強にはなってよかったのですが。。。

Charts

Price

【業務効率化への第一歩】PythonでPDFファイルを自由自在に操る!基礎マスターコース - Price chart

Rating

【業務効率化への第一歩】PythonでPDFファイルを自由自在に操る!基礎マスターコース - Ratings chart

Enrollment distribution

【業務効率化への第一歩】PythonでPDFファイルを自由自在に操る!基礎マスターコース - Distribution chart

Related Topics

3887628
udemy ID
3/3/2021
course created date
4/16/2021
course indexed date
Bot
course submited by