g6u Geschrieben 4. Februar 2023 Geschrieben 4. Februar 2023 Moin, hier mein aktueller Projektantrag, den ich runtergeschrieben habe, es ist nicht die finale Version. Es geht nur um die grobe Einschätzung der Annahme des Antrags, bitte um relativ schnelle Rückmeldung da ich nicht mehr viel Zeit habe und mir sonnst schnell ein anderes Projekt aus den Fingern ziehen müsste. Projektbeschreibung: Kunde X setzt derzeit verschiedene Tools ein um eingehende Dokumente wie Rechnungen & Lieferscheine automatisch zu verarbeiten und in OCR fähige PDF-Dateien zu konvertieren, diese werden dann von Kundeneigener Software nach komplexen Parametern weiter verarbeitet. Ein Problem stellen die hohen Lizenzkosten der jeweiligen Tools da sowie die möglichen Mehrkosten durch unsere Support-Abbteillung, da der Workflow vollautomatisch ist und bei Fehlern in der OCR-Erkennung der Prozess nur durch unsere Mitarbeiter neugestartet werden kann, so verzögern sich Prozesse und durch die Überschreitung einer zugesicherten Support-Arbeitszeit durch unser Unternehmen, entstehen weitere Kosten für den Kunden, deswegen möchte der Kunde eine möglichst kostengünstigere und effizietere Lösung für den Arbeitsschritt des Erfassens und der Zuordnung der einzelnen Dokumente über mehrere Zugangswege, die OCR fähigen PDF-Dateien sollen dann in einem vom Kunden definierten Ordner abgelegt werden, damit der Kunde sie von dort abholen und weiterverarbeiten kann. Ist analyse: Der Kunde setzt im den aktuellen Prozess, für die Erfassung der Dokumente auf eine veraltete Version von der IRISOCR sdk, dieses übernimmt die OCR Verarbeitung, hier haben die Mitarbeiter keinerlei Benutzeroberfläche und können bei OCR Fehlern keine Neuverarbeitung anstoßen ohne das Dokument neu zu scannen/bereitzustellen. Im weiteren Verlauf wird die OCR lesbare PDF mit komplexen Schlüsseln von einem Programm des Kunden weiterverarbeitet, dies ist für das Projekt nicht mehr relevant. 2.1 Was soll am Ende des Projekts erreicht sein? Eine kostengünstigere Lösung für die automatische OCR Verarbeitung von eingehenden Dokumenten sowie das manuelle anstoßen einer erneuten OCR Verarbeitung. Die Lösung muss genutzte Funktionen der alten Software beinhalten, sowie weitere Anforderungen die in 2.2 weiter definiert sind. 2.2 Welche Anforderungen müssen erfüllt sein? - Vollautomatische Verarbeitung der eingehenden Dokumente, diese werden durch verschiedene Quellen in einem Netzwerkordner auf dem Server bereitgestellt, in der die Software durchgehend auf neue Dokumente horcht. - Benutzeroberfläche in der mit einem zentralen Benutzer die OCR Erkennung neu angestoßen werden kann, ohne das Dokument erneut bereitzustellen - Zwingende HTTPs Verbindung zur Benutzeroberfläche - Die Dokumente müssen einsehbar sein und ihre OCR Fähigkeit besitzen um zu prüfen ob alle Daten korrekt erkannt wurden - Die Informationsdaten zu einem Dokument müssen bearbeitbar sein bspw. Dateiname außerdem muss es möglich sein ein falsch erkanntes Dokument neu zu zuweisen bspw. Rechnung wird als Lieferschein erkannt, als Rechnung klassifizieren. - Durch Interne Vorgaben muss der Datenbankserver dediziert auf einem separaten Server liegen - Die Benutzeroberfläche muss durch eine Anmeldemaske geschützt sein, sodass nur Mitarbeiter mit den Benutzerdaten des Zentrallbenutzers mit den Berechtigungen Zugriff auf die Dokumente bzw. die Benutzeroberfläche haben. - Die eingehenden Dokumente müssen manuell über die Benutzeroberfläche hinzufügbar sein - Die eingehenden Dokumente müssen verschiedene Dateiformate sein wie bspw. Dokumentdateitypen .docxsowie Bilddateitypen wie .jpeg 2.3. Welche Einschränkungen müssen berücksichtigt werden? - Testdurchläufe sind nur simuliert, nicht mit echten Kundendaten möglich. - Testdurchläufe werden mit Musterdokumenten durchgeführt, die in das Verzeichnis auf das die Lösung horcht manuell übertragen werden. - Die Umgebung ist simuliert in einem exklusiven Bereich unseres Rechenzentrums ***, die einzelnen Server haben Zugriff auf das Internet, aber nicht auf das interne Kundennetz, somit ist die realistische Simulation nicht möglich, da die Einbindung nicht vorgesehen ist. Zeitplanung 3h 1. Initialisierungsphase Ist-Zustand 1h Soll-Zustand 2h 2. Entwurfsphase 8,5h Evaluirung verschiedener Softwarelösungen 4h Kosten-Nutzenanalyse 2h Wirtschaftlichkeitsbetrachtung 2,5h 3. Durchführungsphase 16,5h Serverhärtung & Grundkonfiguration 2h Installation von postgresql 1h Installation von Docker 1,5h Installation der ausgewählten Softwarelösung 2h Konfiguration der postgres Datenbank 2h Konfiguration von Docker & Webservers 3h Konfiguration der Softwarelösung 5h 4. Abschlussphase 12h Erstellung einer kleiner Anwenderdokumentation 2h Soll-Ist-Vergleich 2h Erstellung der Projektdokumentation 8h Zitieren
Dr. Octagon Geschrieben 4. Februar 2023 Geschrieben 4. Februar 2023 Halte erstmal die Installationsdauer in einigen Punkten für zu lang... z.B. welche "ausgewählte" SW-Lösung braucht 2 h allein zur Installation, wenn die anschliessende Konfiguration "nur noch" 5 h dauern soll... und dann kommen noch (etwa schon vorgegeben?) Docker und PostgreSQL.. das ist ja allein schon n halber Tag. Zitieren
g6u Geschrieben 5. Februar 2023 Autor Geschrieben 5. Februar 2023 vor 6 Stunden schrieb Dr. Octagon: Halte erstmal die Installationsdauer in einigen Punkten für zu lang... z.B. welche "ausgewählte" SW-Lösung braucht 2 h allein zur Installation, wenn die anschliessende Konfiguration "nur noch" 5 h dauern soll... und dann kommen noch (etwa schon vorgegeben?) Docker und PostgreSQL.. das ist ja allein schon n halber Tag. Es geht mir eher um die Bewertung des Projektes an sich. Das die Zeitplanung bisschen übertrieben ist, hab ich auch gemerkt, wird noch optimiert falls das Projekt an sich Annahme fähig ist. Zitieren
charmanta Geschrieben 5. Februar 2023 Geschrieben 5. Februar 2023 vor 13 Stunden schrieb 9msinformatik: 3. Durchführungsphase 16,5h Serverhärtung & Grundkonfiguration 2h Installation von postgresql 1h Installation von Docker 1,5h Installation der ausgewählten Softwarelösung 2h Konfiguration der postgres Datenbank 2h Konfiguration von Docker & Webservers 3h Eigentlich annahmefähig. Aber obiges deutet auf eine bereits getroffene Auswahl hin und das geht nicht. Entscheide wirklich! Frei g6u reagierte darauf 1 Zitieren
MartinSt Geschrieben 5. Februar 2023 Geschrieben 5. Februar 2023 vor 14 Stunden schrieb 9msinformatik: Installation von postgresql 1h Woher weißt du vor Auswahl der Lösung, dass PostgreSQL benötigt wird? Zitieren
g6u Geschrieben 5. Februar 2023 Autor Geschrieben 5. Februar 2023 vor 6 Stunden schrieb charmanta: Eigentlich annahmefähig. Aber obiges deutet auf eine bereits getroffene Auswahl hin und das geht nicht. Entscheide wirklich! Frei hast recht, ich hab mehrere Lösungen im Auge, die werden auch gegeneinander abgewogen, das muss ich dann wohl noch umschreiben. @MartinSt kann ich eigentlich nicht wissen, bei uns wird allerdings grundsätzlich für kleinere System postgres eingesetzt genau so eine Vorgabe wie die dedizierung der Datenbank, muss das raus? Zitieren
MartinSt Geschrieben 5. Februar 2023 Geschrieben 5. Februar 2023 wenn ihr PostgreSQL kennt und trotzdem für Installation und Konfiguration 3 h drin stehen, was machst du da die restlichen 2,5 h? g6u reagierte darauf 1 Zitieren
g6u Geschrieben 5. Februar 2023 Autor Geschrieben 5. Februar 2023 Ich schick eine aktualisierte Zeitplanung später hier rein. Zitieren
g6u Geschrieben 6. Februar 2023 Autor Geschrieben 6. Februar 2023 So hier vorerst meine Finale Version 1. Frage Grafische oder tabellarische Darstellung Reicht hier ein Gant Diagramm oder ist etwas anderes gemeint? 2. Frage reicht "So soll auch gewährleistet sein, dass unsere Mitarbeiter weniger gezwungen sind, bei der Bearbeitung von Tickets zur Fehlerhaften OCR Verarbeitung, in die Dokumente einsehen zu müssen, um den Datenschutz zu erhöhen." das für die Erwähnung vom Datenschutz aus, oder was genau ist dort gemeint was muss ich erwähnen, eine reine Absicherung der Plattform durch Anmeldung ist ja auch "Datenschutz" Antrag: Implementierung eines neuen Document Managment System mit dediziertem Datenbankserver und HTTPs Verschlüsselung um einen Arbeitsschritt eines Dokumentenworkflows zu verbessern Beschreibung: Kunde X setzt derzeit verschiedene Tools ein um eingehende Dokumente wie Rechnungen & Lieferscheine automatisch zu verarbeiten und in OCR fähige PDF-Dateien zu konvertieren, diese werden dann von Kundeneigener Software nach komplexen Parametern weiter verarbeitet. Ein Problem stellen die hohen Lizenzkosten der jeweiligen Tools des Gesamtprozesses beim Kunden da, sowie die möglichen Mehrkosten durch unsere Support-Abbteillung, da der Workflow vollautomatisch ist und bei Fehlern in der OCR-Erkennung, der Prozess nur durch unsere Mitarbeiter neugestartet werden kann, so verzögern sich Prozesse und durch die Überschreitung einer zugesicherten Support-Arbeitszeit durch unser Unternehmen, entstehen weitere Kosten für den Kunden, deswegen möchte der Kunde eine möglichst kostengünstigere und effizietere Lösung für den Arbeitsschritt des Erfassens und der Zuordnung der einzelnen Dokumente über mehrere Zugangswege, die OCR fähigen PDF-Dateien sollen dann in einem vom Kunden definierten Ordner abgelegt werden, damit der Kunde sie von dort abholen und weiterverarbeiten kann. Ist-Analyse: Der Kunde setzt im den aktuellen Prozess, für die Erfassung der Dokumente auf eine veraltete Version von der IRISOCR sdk in einem eigenen Tool, dieses übernimmt die OCR Verarbeitung, hier haben die Mitarbeiter keinerlei Benutzeroberfläche und können bei OCR Fehlern keine Neuverarbeitung anstoßen ohne das Dokument neu zu scannen/bereitzustellen. Im weiteren Verlauf wird die OCR lesbare PDF mit komplexen Schlüsseln von einem Programm des Kunden weiterverarbeitet, dies ist für das Projekt nicht mehr relevant. Was soll am Ende erreicht sein: Eine kostengünstigere Lösung für die automatische OCR Verarbeitung von eingehenden Dokumenten sowie das manuelle anstoßen einer erneuten OCR Verarbeitung der Dokumente. So soll auch gewährleistet sein, dass unsere Mitarbeiter weniger gezwungen sind, bei der Bearbeitung von Tickets zur Fehlerhaften OCR Verarbeitung, in die Dokumente einsehen zu müssen, um den Datenschutz zu erhöhen. Die Lösung muss genutzte Funktionen der alten Software beinhalten, sowie weitere Anforderungen die in 2.2 weiter definiert sind. Welche Anforderungen müssen erfüllt sein: - Vollautomatische Verarbeitung der eingehenden Dokumente, diese werden durch verschiedene Quellen in einem Netzwerkordner auf dem Server bereitgestellt, in der die Software durchgehend auf neue Dokumente horcht. - Benutzeroberfläche in der mit einem zentralen Benutzer die OCR Erkennung neu angestoßen werden kann, ohne das Dokument erneut bereitzustellen - Zwingende HTTPs Verbindung zur Benutzeroberfläche - Die Dokumente müssen einsehbar sein und ihre OCR Fähigkeit besitzen um zu prüfen ob alle Daten korrekt erkannt wurden - Die Informationsdaten zu einem Dokument müssen bearbeitbar sein bspw. Dateiname außerdem muss es möglich sein ein falsch erkanntes Dokument neu zu zuweisen bspw. Rechnung wird als Lieferschein erkannt, als Rechnung klassifizieren. - Durch Interne Vorgaben muss der Datenbankserver dediziert auf einem separaten Server liegen - Die Benutzeroberfläche muss durch eine Anmeldemaske geschützt sein, sodass nur Mitarbeiter mit den Benutzerdaten des Zentrallbenutzers mit den Berechtigungen Zugriff auf die Dokumente bzw. die Benutzeroberfläche haben. - Die eingehenden Dokumente müssen manuell über die Benutzeroberfläche hinzufügbar sein - Die eingehenden Dokumente müssen verschiedene Dateiformate sein wie bspw. Dokumentdateitypen .docxsowie Bilddateitypen wie .jpeg - Vorzugsweise setzen wir in unseren Verfahren, auf Installationen in Docker Containern sowie bei Nutzung von einem Datenbankmanagementsystem auf das DBMS Postgresql Welche Einschränkungen müssen berücksichtigt werden: - Testdurchläufe sind nur simuliert, nicht mit echten Dokumenten des Kunden möglich. - Testdurchläufe werden mit Musterdokumenten durchgeführt, die in das Verzeichnis auf das die Lösung horcht manuell übertragen werden. - Die Umgebung ist simuliert in einem exklusiven Bereich unseres Rechenzentrums RZ², die einzelnen Server haben Zugriff auf das Internet, aber nicht auf das interne Kundennetz, somit ist die realistische Simulation nicht möglich, da die Einbindung nicht vorgesehen ist. Was ist zur Erfüllung der Zielsetzung erforderlich? Funktionierende VM Umgebung von 2 virtuellen Maschinen mit Ubuntu Betriebssystem, dabei muss eine Virtuelle Maschine mindestens 4GB und die 2. Virtuelle Maschine mindestens 2GB DDR4 Arbeitsspeicher um die Vorrausetzungen für die Softwarelösung/Webserver und des Datenbankmanagementsystem zu gewährleisten, außerdem müssen die Maschinen Internetzugriff haben um Pakete aktualisieren und installieren zu können. Hauptaufgaben: 1. Initialisierungsphase 2. Entwurfsphase 3. Durchführungsphase 4. Abschlusspha Teilaufgaben: 1. Initialisierungsphase Ist-Zustand Soll-Zustand 2. Entwurfsphase Evaluirung verschiedener Softwarelösungen Kosten-Nutzenanalyse Wirtschaftlichkeitsbetrachtung 3. Durchführungsphase Serverhärtung & Grundkonfiguration Installation des Datenbankmanagementsystem Installation von Docker Installation der ausgewählten Softwarelösung Konfiguration der Datenbank Konfiguration von Docker & Webservers Konfiguration der Softwarelösung 4. Abschlussphase Durchführung von Testdurchläufen Erstellung einer kleiner Anwenderdokumentation Soll-Ist-Vergleich Erstellung der Projektdokumentation Zeitplanung: 1. Initialisierungsphase (3h) Ist-Zustand (1h) Soll-Zustand (2h) 2. Entwurfsphase 8,5h) Evaluirung verschiedener Softwarelösungen (4h) Kosten-Nutzenanalyse (2h) Wirtschaftlichkeitsbetrachtung (2,5h) 3. Durchführungsphase (13,5h) Serverhärtung & Grundkonfiguration (2h) Installation von des Datenbankmanagementsystem (1h) Installation von Docker (1,5h) Installation der ausgewählten Softwarelösung (1h) Konfiguration der Datenbank (2h) Konfiguration von Docker & Webservers (2h) Konfiguration der Softwarelösung (4h) 4. Abschlussphase (15h) Durchführung von Testdurchläufen (2h) Erstellung einer kleiner Anwenderdokumentation (2h) Soll-Ist-Vergleich (1h) Erstellung der Projektdokumentation (8h) Wenn ihr das absegnet @charmanta @MartinSt gehe ich nochmal mit Rechtschreib/Grammatik Korrektur drüber. Zitieren
g6u Geschrieben 6. Februar 2023 Autor Geschrieben 6. Februar 2023 Update 3. Durchführungsphase (14,5h) Serverhärtung & Grundkonfiguration (2,5h) Installation von des Datenbankmanagementsystem (1h) Installation von Docker (1,5h) Installation der ausgewählten Softwarelösung (1,5h) Konfiguration der Datenbank (1h) Konfiguration von Docker & Webservers (2,5h) Konfiguration der Softwarelösung (4,5h) 4. Abschlussphase (14h) Durchführung von Testdurchläufen (2,5h) Erstellung einer Anwenderdokumentation (2h) Soll-Ist-Vergleich (1,5h) Erstellung der Projektdokumentation (8h) Zitieren
charmanta Geschrieben 7. Februar 2023 Geschrieben 7. Februar 2023 alleine dass Du Docker installierst passt nicht. Wieso denn ? Nach wie vor lässt das ganz stark vermuten dass eine Entscheidung bereits getroffen wurde und das geht nicht. Die Installation von Docker und Install/Konfig einer DB und eines Webservers passen nicht zur Prüfungsordnung des FiSi. Ich vermute, dass das Projekt nur unter Auflagen genehmigt wird. Wir würden dazu schreiben dass Du drei verschiedene Produkte zu betrachten hättest und vermutlich noch mehr Zeit in die Planungsphase verschieben solltest. Lasss mal Docker und DB Konfig raus ... 10 Stunden Vergleich von Lösungen, dann sollte das angenommen werden Zitieren
Empfohlene Beiträge
Dein Kommentar
Du kannst jetzt schreiben und Dich später registrieren. Wenn Du ein Konto hast, melde Dich jetzt an, um unter Deinem Benutzernamen zu schreiben.