[ Die Liste der Themen ist derzeit im Aufbau. Mehr Themen folgen. ]
|
Thema |
Bearbeitet durch |
| 1. |
Texterkennung für größere Datenmengen
Anzeigen liegen beim Tagblatt derzeit teilweise nur als Bilder vor. Vor dem täglichen Import in das Redakionssystem sollen diese Bilder per OCR nach Text durchsucht werden. Diese Daten sollen wenn möglich strukturiert in eine XML-Datei eingearbeitet werden. Die OCR soll dabei größere Mengen an Bildmaterial möglichst ressourcenschonend und schnell verarbeiten können.
Ansprechpartner: Torsten Grust |
|
| 2. |
Solr/Lucene-Suche bei großen Artikelbeständen
Für die Suche nach Datensätzen verwendet das Tagblatt Solr/Lucene. Derzeit gibt es einen Datenbestand von etwa 200.000 Datensätzen. Die Aufgabe ist, zu überprüfen, wie gut die Suchmöglichkeiten ausgereizt wurden, oder ob es hier noch Entwicklungsmöglichkeiten für den Verlag gibt.
Ansprechpartner: Torsten Grust
|
|
|