Monday, 4 October 2021

Camelot

なんと、

  学務のサイトからアクセスできるシラバスには教室が載ってない

という素晴らしい問題があって、もちろん、一覧とかもできない。なので、適当にWebを毎年作っているという無駄。

まぁ、当てつけでやってる感もなくはない。Webのもっとも重要な部分な気もするんだけど。どうでもいい人にはどうでもいい。

ところが使えるのは

  事務が作った適当なPDF

で、またこれが pdftotext 程度だと

  文字かシャッフルされて使い物にならない

なんですが、

  Camelot という python module がPDFの表解析に使えるらしい

でも、installが激ムズ。だが、

  Docker image がある

のだが、rootless podman だと大変。なのだが、

  rootful podman image を作ってからだと早くできるってのを発見

で、これを json に整形すると anatoufz が書いた golang program で HTML が生成されるらしいです。

え、大学院もあるの? やめて〜

https://camelot-py.readthedocs.io/en/master/index.html

No comments: