Notebook
これは日々の作業を通して学んだことや毎日の生活で気づいたことをを記録しておく備忘録である。
HTML ファイル生成日時: 2025/08/19 19:16:06.895 (台灣標準時)
Python で gzip で圧縮されたファイルを読む方法 (2023 年 07 月中旬)
Python で gzip で圧縮されたファイルを読む方法は以下の通りでござる。こ
こでは、 MPCORB.DAT.gz というファイルを読み込むことを考えるでござる。
<import gzip> して、 <gzip.open (filename, 'r')> とした後、
gzip.open が返すファイルハンドルを使ってファイルの内容を読めばよいよう
でござる。
#!/usr/pkg/bin/python3.10
#
# Time-stamp: <2023/07/17 13:31:53 (CST) daisuke>
#
# importing gzip module
import gzip
# file to read
file_gzipped = 'MPCORB.DAT.gz'
# opening file
with gzip.open (file_gzipped, 'r') as fh_gz:
# reading file
data = fh_gz.readlines ()
# printing first 20 lines
for line_rawbytes in data[:20]:
# conversion from raw bytes into UTF-8 string
line_utf8 = line_rawbytes.decode ()
# printing a line
print (f'{line_utf8}', end='')
注意が必要だった点は、 gzip.open を使うと、読み込んだファイルの内容は
raw bytes になることでござった。 .decode () を使って UTF-8 に変換して
あげないといけないでござる。
実行結果は以下の通りでござる。
% ./read_gz_file.py
MINOR PLANET CENTER ORBIT DATABASE (MPCORB)
This file contains published orbital elements for all numbered and unnumbered
multi-opposition minor planets for which it is possible to make reasonable
predictions. It also includes published elements for recent one-opposition
minor planets and is intended to be complete through the last issued Daily
Orbit Update MPEC. As such it is intended to be of interest primarily
to astrometric observers.
Software programs may include this datafile amongst their datasets, as
long as this header is included (it is acceptable if it is contained
in a file separate from the actual data) and that proper attribution
to the Minor Planet Center is given. Credit to the individual orbit
computers is implicit by the inclusion of a reference and the name of
the orbit computer on each orbit record. Information on how to obtain
updated copies of the datafile must also be included.
The work of the individual astrometric observers, without whom none of
the work of the Minor Planet Center would be possible, is gratefully
acknowledged. Credit to the individual observers is implicit by the
- About this article:
- author: daisuke
- file: 20230717_01.html
- category: Computer___Python
- title: Python で gzip で圧縮されたファイルを読む方法 (2023 年 07 月中旬)
- mode: public
- last modified: 2023/07/17 14:42:53 (Taiwan Standard Time)
- html generated: 2025/08/19 19:16:06.895 (Taiwan Standard Time)
Frequently accessed files
- Misc___Taiwan/20240207_00.html
- 222 page views
- title: 台灣から台灣の外に EMS で荷物を発送する方法
- Misc___Taiwan/20240819_00.html
- 187 page views
- title: 住所から台灣の郵便番号を調べる方法
- Computer___Network/20240130_00.html
- 180 page views
- title: Google Colaboratory で Python 3.12 を使う方法
- Computer___NetBSD/20230119_00.html
- 170 page views
- title: NetBSD でバイナリーパッケージを利用する方法
- Computer___TeX/20231107_00.html
- 149 page views
- title: LaTeX での counter の利用方法について
- Computer___Network/20230516_00.html
- 139 page views
- title: OpenVPN 2.6 を使い VPN Gate に接続するときの注意点
- Computer___Network/20241214_00.html
- 117 page views
- title: Google Colab で Python 3.12 を使う方法
- Misc___Taiwan/20240903_01.html
- 109 page views
- title: 台湾の郵便局で EMS を利用して荷物を海外に送る方法
- Computer___NetBSD/20250301_01.html
- 109 page views
- title: yt-dlp で YouTube の動画をダウンロードするときのこと
- Computer___Network/20230726_00.html
- 100 page views
- title: git の SSL certificate problem の解決方法
- Computer___NetBSD/20240805_03.html
- 83 page views
- title: NetBSD 10 のインストール
- Computer___TeX/20230726_01.html
- 83 page views
- title: Beamer の Metropolis テーマで block の色を変える方法
- Computer___Python/20250330_00.html
- 79 page views
- title: Jupyter Notebook で Matplotlib を使うときのこと
- Misc___Japan/20240610_00.html
- 77 page views
- title: NHK ラジオの「聞き逃し」の変更点 (2024 年 06 月)
- Misc___Taiwan/20250728_01.html
- 68 page views
- title: 「我那小小多山的國家」という言葉が流行っている
- Computer___WWW/20230522_02.html
- 68 page views
- title: HTML でプログラムのコードを書くときの設定
- Computer___Hardware/20240820_00.html
- 66 page views
- title: Raspberry Pi 5 の演算性能
- Computer___TeX/20240414_00.html
- 66 page views
- title: LuaTeX での fontspec を使ったフォントの設定の方法
- Food___Taiwan/20230609_06.html
- 66 page views
- title: 「越芳越南牛肉河粉」のフォー
- Computer___FreeBSD/20220621_0.html
- 64 page views
- title: FreeBSD での X.org の設定の仕方
- Computer___TeX/20240414_01.html
- 63 page views
- title: LuaTeX を使って日本語と中国語の漢字が混在した PDF ファイルを作成する方法
- Computer___TeX/20240411_00.html
- 62 page views
- title: LuaTeX を使って PDF ファイルを作成する方法
- Computer___Python/20240101_00.html
- 61 page views
- title: Matplotlib の 3D plot においての注意点
- Computer___NetBSD/20250307_00.html
- 60 page views
- title: uim と mozc による日本語入力の設定について
- Computer___NetBSD/20250409_00.html
- 59 page views
- title: Raspberry Pi 5 に NetBSD-10.1 をインストールする手順
- Computer___NetBSD/20241102_00.html
- 58 page views
- title: ImageMagick の convert コマンドについて
- Food___Taiwan/20230608_04.html
- 56 page views
- title: 「田園美食屋」の咖哩煎雞腿
- Computer___NetBSD/20240810_00.html
- 55 page views
- title: Raspberry Pi 5 に NetBSD-10 をインストールしてみた
- Computer___TeX/20240410_00.html
- 54 page views
- title: pdfTeX を使って PDF ファイルを作る方法
- Food___Taiwan/20230711_15.html
- 53 page views
- title: 「東方美早餐店」での朝ご飯 (2023 年 06 月中旬)
HTML file generated by Kinoshita Daisuke.