Open Source Texterkennung mit Tesseract OCR
Die bei HP entstandene und seit einigen Jahren von Google gepflegte OCR Engine Tesseract ist inzwischen ziemlich gut und hat eine Layout-Analyse mit Spalten-Erkennung. Da per Default keine GUI dabei ist, kann man auf Tools wie Gimagereader zurückgreifen. Eine Einführung in Tesseract gibt es auf heise open.
Posted at 10:42nachm. Sep. 04, 2012 by cetixx in Links | Kommentare [0]
Wir bauen uns ein Data Warehouse mit MySQL
Kleine, aber feine Präsentation zum Einstieg ins Thema Data Warehouse und hier im Speziellen mit MySQL von Oli Sennhauser auf slideshare.net.
Posted at 10:42nachm. Sep. 04, 2012 by cetixx in General | Kommentare [0]
mysqldump: Error 2013: Lost connection to MySQL server...
Falls einem mal der Fehler 2013 bei mysqldump
mysqldump: Error 2013: Lost connection to MySQL server during query when dumping table `...` at row: ...
über den Weg läuft, dem dürfte das Erhöhen zweier net_*_timeout Parameter weiterhelfen. Zum Einen in der my.conf:
net_read_timeout = 120
net_write_timeout = 900
Und wenn man das gleich aktiv haben will noch ohne Neustart:
set global net_read_timeout = 120;
set global net_write_timeout = 900;
Die Werte sind in Sekunden. Ich hatte das Problem, beim Sichern auf einen langsamen NFS-Mount. Die Meldung selber deutet eigentlich auf ein ganz anderes Problem hin und ist ziemlich irreführend. Nun ja, wenn da auf jeden Fall mehrere Backups liefen, wurde das teilweise arg langsam. Die Parameter schufen Abhilfe.
Posted at 06:26nachm. Sep. 04, 2012 by cetixx in Tipps | Kommentare [2]