Commit 031f993e authored by Christoph's avatar Christoph

Fix parsing of WS15/16 eva pdfs

parent 6621bab3
......@@ -47,7 +47,7 @@ def readMeta(pdf, isFileName=True):
### to my knowledge those of 12 SS and later
ss_long_filter_regex = re.compile("^SS 20(..) • ([\S ]+) • ([\S ]+) • ([\S ]+)", re.MULTILINE | re.UNICODE)
ss_short_filter_regex = re.compile("^SS (..) • ([\S ]+) • ([\S ]+) • ([\S ]+)", re.MULTILINE | re.UNICODE)
ws_long_filter_regex = re.compile("^WS ..(..)/.. • ([\S ]+) • ([\S ]+) • ([\S ]+)", re.MULTILINE | re.UNICODE)
ws_long_filter_regex = re.compile("^WS ..(..)/.. ? • ([\S ]+) • ([\S ]+) • ([\S ]+)", re.MULTILINE | re.UNICODE)
ws_short_filter_regex = re.compile("^WS (..)/.. • ([\S ]+) • ([\S ]+) • ([\S ]+)", re.MULTILINE | re.UNICODE)
meta = {}
......
  • Funktioniert grad auf meinen 2 Testpdfs. Würde später aber noch gegen mehr und alte PDFs testen vor dem merge

  • man könnte doch da auch gleich \s schreiben, oder? weiß nicht wie viel semantik in der anzahl der leerzeichen steckt, oder ob das eher "hat sich der herr frickel beim c&p vertan?" is..

  • mentioned in issue #98 (closed)

    Toggle commit list
Markdown is supported
0% or
You are about to add 0 people to the discussion. Proceed with caution.
Finish editing this message first!
Please register or to comment