Zum Inhalt springen

Projektantrag: Implementierung eines neuen Document Managment System mit dediziertem Datenbankserver und HTTPs Verschlüsselung um einen Arbeitsschritt eines Dokumentenworkflows zu verbessern


Empfohlene Beiträge

Geschrieben

Moin, hier mein aktueller Projektantrag, den ich runtergeschrieben habe, es ist nicht die finale Version. Es geht nur um die grobe Einschätzung der Annahme des Antrags, bitte um relativ schnelle Rückmeldung da ich nicht mehr viel Zeit habe und mir sonnst schnell ein anderes Projekt aus den Fingern ziehen müsste.

 

Projektbeschreibung:
Kunde X setzt derzeit verschiedene Tools ein um eingehende Dokumente wie Rechnungen & Lieferscheine
automatisch zu verarbeiten und in OCR fähige PDF-Dateien zu konvertieren, diese werden dann von Kundeneigener
Software nach komplexen Parametern weiter verarbeitet. Ein Problem stellen die hohen Lizenzkosten der jeweiligen Tools
da sowie die möglichen Mehrkosten durch unsere Support-Abbteillung, da der Workflow vollautomatisch ist und bei Fehlern
in der OCR-Erkennung der Prozess nur durch unsere Mitarbeiter neugestartet werden kann, so verzögern sich Prozesse und durch
die Überschreitung einer zugesicherten Support-Arbeitszeit durch unser Unternehmen, entstehen weitere Kosten für den Kunden, deswegen
möchte der Kunde eine möglichst kostengünstigere und effizietere Lösung für den Arbeitsschritt des Erfassens und der Zuordnung der einzelnen Dokumente
über mehrere Zugangswege, die OCR fähigen PDF-Dateien sollen dann in einem vom Kunden definierten Ordner abgelegt werden, damit der Kunde sie von dort abholen und weiterverarbeiten kann.
 

 

Ist analyse:

Der Kunde setzt im den aktuellen Prozess, für die Erfassung der Dokumente auf eine veraltete Version von der IRISOCR sdk, dieses übernimmt die OCR Verarbeitung, hier haben die Mitarbeiter keinerlei Benutzeroberfläche und können bei OCR Fehlern keine Neuverarbeitung anstoßen ohne das Dokument neu zu scannen/bereitzustellen. Im weiteren Verlauf wird die OCR lesbare PDF mit komplexen Schlüsseln von einem Programm des Kunden weiterverarbeitet, dies ist für das Projekt nicht mehr relevant.

 

2.1 Was soll am Ende des Projekts erreicht sein?

Eine kostengünstigere Lösung für die automatische OCR Verarbeitung von eingehenden Dokumenten sowie das manuelle anstoßen einer erneuten OCR Verarbeitung. Die Lösung muss genutzte Funktionen der alten Software beinhalten, sowie weitere Anforderungen die in 2.2 weiter definiert sind.

 

2.2 Welche Anforderungen müssen erfüllt sein?

- Vollautomatische Verarbeitung der eingehenden Dokumente, diese werden durch verschiedene Quellen in einem Netzwerkordner auf dem Server bereitgestellt, in der die Software durchgehend auf neue Dokumente horcht.
- Benutzeroberfläche in der mit einem zentralen Benutzer die OCR Erkennung neu angestoßen werden kann, ohne das Dokument erneut bereitzustellen
- Zwingende HTTPs Verbindung zur Benutzeroberfläche
- Die Dokumente müssen einsehbar sein und ihre OCR Fähigkeit besitzen um zu prüfen ob alle Daten korrekt erkannt wurden
- Die Informationsdaten zu einem Dokument müssen bearbeitbar sein bspw. Dateiname außerdem muss es möglich sein ein falsch erkanntes Dokument neu zu zuweisen bspw. Rechnung wird als Lieferschein erkannt, als Rechnung klassifizieren.
- Durch Interne Vorgaben muss der Datenbankserver dediziert auf einem separaten Server liegen
- Die Benutzeroberfläche muss durch eine Anmeldemaske geschützt sein, sodass nur Mitarbeiter mit den Benutzerdaten des Zentrallbenutzers mit den Berechtigungen Zugriff auf die Dokumente bzw. die Benutzeroberfläche haben.
- Die eingehenden Dokumente müssen manuell über die Benutzeroberfläche hinzufügbar sein
- Die eingehenden Dokumente müssen verschiedene Dateiformate sein wie bspw. Dokumentdateitypen .docxsowie Bilddateitypen wie .jpeg
 

2.3. Welche Einschränkungen müssen berücksichtigt werden?

- Testdurchläufe sind nur simuliert, nicht mit echten Kundendaten möglich.
- Testdurchläufe werden mit Musterdokumenten durchgeführt, die in das Verzeichnis auf das die Lösung horcht manuell übertragen werden.
- Die Umgebung ist simuliert in einem exklusiven Bereich unseres Rechenzentrums ***, die einzelnen Server haben Zugriff auf das Internet, aber nicht auf das interne Kundennetz, somit ist die realistische Simulation nicht möglich, da die Einbindung nicht vorgesehen ist.

 

 


Zeitplanung 3h
1. Initialisierungsphase
Ist-Zustand 1h
Soll-Zustand 2h

2. Entwurfsphase 8,5h
Evaluirung verschiedener Softwarelösungen 4h
Kosten-Nutzenanalyse 2h
Wirtschaftlichkeitsbetrachtung 2,5h

3. Durchführungsphase 16,5h
Serverhärtung & Grundkonfiguration 2h
Installation von postgresql 1h
Installation von Docker 1,5h
Installation der ausgewählten Softwarelösung 2h
Konfiguration der postgres Datenbank 2h
Konfiguration von Docker & Webservers 3h
Konfiguration der Softwarelösung 5h

4. Abschlussphase 12h

Erstellung einer kleiner Anwenderdokumentation 2h
Soll-Ist-Vergleich 2h
Erstellung der Projektdokumentation 8h

 

 

 

Geschrieben

Halte erstmal die Installationsdauer in einigen Punkten für zu lang... z.B. welche "ausgewählte" SW-Lösung braucht 2 h allein zur Installation, wenn die anschliessende Konfiguration "nur noch"  5 h dauern soll... und dann kommen noch (etwa schon vorgegeben?) Docker und  PostgreSQL.. das ist ja allein schon n halber Tag. ;)

 

 

 

  • mapr änderte den Titel in Projektantrag: Implementierung eines neuen Document Managment System mit dediziertem Datenbankserver und HTTPs Verschlüsselung um einen Arbeitsschritt eines Dokumentenworkflows zu verbessern
Geschrieben
vor 6 Stunden schrieb Dr. Octagon:

Halte erstmal die Installationsdauer in einigen Punkten für zu lang... z.B. welche "ausgewählte" SW-Lösung braucht 2 h allein zur Installation, wenn die anschliessende Konfiguration "nur noch"  5 h dauern soll... und dann kommen noch (etwa schon vorgegeben?) Docker und  PostgreSQL.. das ist ja allein schon n halber Tag. ;)

Es geht mir eher um die Bewertung des Projektes an sich. Das die Zeitplanung bisschen übertrieben ist, hab ich auch gemerkt, wird noch optimiert falls das Projekt an sich Annahme fähig ist.

Geschrieben
vor 13 Stunden schrieb 9msinformatik:

3. Durchführungsphase 16,5h
Serverhärtung & Grundkonfiguration 2h
Installation von postgresql 1h
Installation von Docker 1,5h
Installation der ausgewählten Softwarelösung 2h
Konfiguration der postgres Datenbank 2h
Konfiguration von Docker & Webservers 3h

Eigentlich annahmefähig. Aber obiges deutet auf eine bereits getroffene Auswahl hin und das geht nicht. Entscheide wirklich! Frei

Geschrieben
vor 6 Stunden schrieb charmanta:

Eigentlich annahmefähig. Aber obiges deutet auf eine bereits getroffene Auswahl hin und das geht nicht. Entscheide wirklich! Frei

hast recht, ich hab mehrere Lösungen im Auge, die werden auch gegeneinander abgewogen, das muss ich dann wohl noch umschreiben.

 

@MartinSt kann ich eigentlich nicht wissen, bei uns wird allerdings grundsätzlich für kleinere System postgres eingesetzt genau so eine Vorgabe wie die dedizierung der Datenbank, muss das raus?

Geschrieben

So hier vorerst meine Finale Version

1. Frage Grafische oder tabellarische Darstellung

Reicht hier ein Gant Diagramm oder ist etwas anderes gemeint?

2. Frage reicht "So soll auch gewährleistet sein, dass unsere Mitarbeiter weniger gezwungen sind, bei der Bearbeitung von Tickets zur Fehlerhaften OCR Verarbeitung, in die Dokumente einsehen zu müssen, um den Datenschutz zu erhöhen." das für die Erwähnung vom Datenschutz aus, oder was genau ist dort gemeint was muss ich erwähnen, eine reine Absicherung der Plattform durch Anmeldung ist ja auch "Datenschutz"

Antrag:

Implementierung eines neuen Document Managment System mit dediziertem Datenbankserver und HTTPs Verschlüsselung um einen Arbeitsschritt eines Dokumentenworkflows zu verbessern
 

Beschreibung:

Kunde X setzt derzeit verschiedene Tools ein um eingehende Dokumente wie Rechnungen & Lieferscheine
automatisch zu verarbeiten und in OCR fähige PDF-Dateien zu konvertieren, diese werden dann von Kundeneigener
Software nach komplexen Parametern weiter verarbeitet. Ein Problem stellen die hohen Lizenzkosten der jeweiligen Tools des Gesamtprozesses beim Kunden
da, sowie die möglichen Mehrkosten durch unsere Support-Abbteillung, da der Workflow vollautomatisch ist und bei Fehlern
in der OCR-Erkennung, der Prozess nur durch unsere Mitarbeiter neugestartet werden kann, so verzögern sich Prozesse und durch
die Überschreitung einer zugesicherten Support-Arbeitszeit durch unser Unternehmen, entstehen weitere Kosten für den Kunden, deswegen
möchte der Kunde eine möglichst kostengünstigere und effizietere Lösung für den Arbeitsschritt des Erfassens und der Zuordnung der einzelnen Dokumente
über mehrere Zugangswege, die OCR fähigen PDF-Dateien sollen dann in einem vom Kunden definierten Ordner abgelegt werden, damit der Kunde sie von dort abholen und weiterverarbeiten kann.

 

Ist-Analyse:

Der Kunde setzt im den aktuellen Prozess, für die Erfassung der Dokumente auf eine veraltete Version von der IRISOCR sdk in einem eigenen Tool, dieses übernimmt die OCR Verarbeitung, hier haben die Mitarbeiter keinerlei Benutzeroberfläche und können bei OCR Fehlern keine Neuverarbeitung anstoßen ohne das Dokument neu zu scannen/bereitzustellen. Im weiteren Verlauf wird die OCR lesbare PDF mit komplexen Schlüsseln von einem Programm des Kunden weiterverarbeitet, dies ist für das Projekt nicht mehr relevant.

 

Was soll am Ende erreicht sein:

Eine kostengünstigere Lösung für die automatische OCR Verarbeitung von eingehenden Dokumenten sowie das manuelle anstoßen einer erneuten OCR Verarbeitung der Dokumente. So soll auch gewährleistet sein, dass unsere Mitarbeiter weniger gezwungen sind, bei der Bearbeitung von Tickets zur Fehlerhaften OCR Verarbeitung, in die Dokumente einsehen zu müssen, um den Datenschutz zu erhöhen.
Die Lösung muss genutzte Funktionen der alten Software beinhalten, sowie weitere Anforderungen die in 2.2 weiter definiert sind.
 

Welche Anforderungen müssen erfüllt sein:

- Vollautomatische Verarbeitung der eingehenden Dokumente, diese werden durch verschiedene Quellen in einem Netzwerkordner auf dem Server bereitgestellt, in der die Software durchgehend auf neue Dokumente horcht.
- Benutzeroberfläche in der mit einem zentralen Benutzer die OCR Erkennung neu angestoßen werden kann, ohne das Dokument erneut bereitzustellen
- Zwingende HTTPs Verbindung zur Benutzeroberfläche
- Die Dokumente müssen einsehbar sein und ihre OCR Fähigkeit besitzen um zu prüfen ob alle Daten korrekt erkannt wurden
- Die Informationsdaten zu einem Dokument müssen bearbeitbar sein bspw. Dateiname außerdem muss es möglich sein ein falsch erkanntes Dokument neu zu zuweisen bspw. Rechnung wird als Lieferschein erkannt, als Rechnung klassifizieren.
- Durch Interne Vorgaben muss der Datenbankserver dediziert auf einem separaten Server liegen
- Die Benutzeroberfläche muss durch eine Anmeldemaske geschützt sein, sodass nur Mitarbeiter mit den Benutzerdaten des Zentrallbenutzers mit den Berechtigungen Zugriff auf die Dokumente bzw. die Benutzeroberfläche haben.
- Die eingehenden Dokumente müssen manuell über die Benutzeroberfläche hinzufügbar sein
- Die eingehenden Dokumente müssen verschiedene Dateiformate sein wie bspw. Dokumentdateitypen .docxsowie Bilddateitypen wie .jpeg
- Vorzugsweise setzen wir in unseren Verfahren, auf Installationen in Docker Containern sowie bei Nutzung von einem Datenbankmanagementsystem auf das DBMS Postgresql

 

Welche Einschränkungen müssen berücksichtigt werden:

- Testdurchläufe sind nur simuliert, nicht mit echten Dokumenten des Kunden möglich.
- Testdurchläufe werden mit Musterdokumenten durchgeführt, die in das Verzeichnis auf das die Lösung horcht manuell übertragen werden.
- Die Umgebung ist simuliert in einem exklusiven Bereich unseres Rechenzentrums RZ², die einzelnen Server haben Zugriff auf das Internet, aber nicht auf das interne Kundennetz, somit ist die realistische Simulation nicht möglich, da die Einbindung nicht vorgesehen ist.

 

Was ist zur Erfüllung der Zielsetzung erforderlich?

Funktionierende VM Umgebung von 2 virtuellen Maschinen mit Ubuntu Betriebssystem, dabei muss eine Virtuelle Maschine mindestens 4GB und die 2. Virtuelle Maschine mindestens 2GB DDR4 Arbeitsspeicher um die Vorrausetzungen für die Softwarelösung/Webserver und des Datenbankmanagementsystem zu gewährleisten, außerdem müssen die Maschinen Internetzugriff haben um Pakete aktualisieren und installieren zu können.

Hauptaufgaben:

1. Initialisierungsphase
2. Entwurfsphase 
3. Durchführungsphase
4. Abschlusspha

Teilaufgaben:

 

1. Initialisierungsphase
Ist-Zustand 
Soll-Zustand

2. Entwurfsphase 
Evaluirung verschiedener Softwarelösungen 
Kosten-Nutzenanalyse
Wirtschaftlichkeitsbetrachtung 

3. Durchführungsphase 
Serverhärtung & Grundkonfiguration 
Installation des Datenbankmanagementsystem
Installation von Docker 
Installation der ausgewählten Softwarelösung 
Konfiguration der Datenbank 
Konfiguration von Docker & Webservers 
Konfiguration der Softwarelösung 

4. Abschlussphase 
Durchführung von Testdurchläufen
Erstellung einer kleiner Anwenderdokumentation 
Soll-Ist-Vergleich 
Erstellung der Projektdokumentation 
 

Zeitplanung:

 

1. Initialisierungsphase  (3h)
Ist-Zustand (1h)
Soll-Zustand (2h)

2. Entwurfsphase 8,5h)
Evaluirung verschiedener Softwarelösungen (4h)
Kosten-Nutzenanalyse (2h)
Wirtschaftlichkeitsbetrachtung (2,5h)

3. Durchführungsphase (13,5h)
Serverhärtung & Grundkonfiguration (2h)
Installation von des Datenbankmanagementsystem (1h)
Installation von Docker (1,5h)
Installation der ausgewählten Softwarelösung (1h)
Konfiguration der Datenbank (2h)
Konfiguration von Docker & Webservers (2h)
Konfiguration der Softwarelösung (4h)

4. Abschlussphase (15h)
Durchführung von Testdurchläufen (2h)
Erstellung einer kleiner Anwenderdokumentation (2h)
Soll-Ist-Vergleich (1h)
Erstellung der Projektdokumentation (8h)

 

 

Wenn ihr das absegnet @charmanta  @MartinSt gehe ich nochmal mit Rechtschreib/Grammatik Korrektur drüber.

 

 

Geschrieben

 

Update

3. Durchführungsphase (14,5h)
Serverhärtung & Grundkonfiguration (2,5h)
Installation von des Datenbankmanagementsystem (1h)
Installation von Docker (1,5h)
Installation der ausgewählten Softwarelösung (1,5h)
Konfiguration der Datenbank (1h)
Konfiguration von Docker & Webservers (2,5h)
Konfiguration der Softwarelösung (4,5h)

4. Abschlussphase (14h)
Durchführung von Testdurchläufen (2,5h)
Erstellung einer Anwenderdokumentation (2h)
Soll-Ist-Vergleich (1,5h)
Erstellung der Projektdokumentation (8h)

 

Geschrieben

alleine dass Du Docker installierst passt nicht. Wieso denn ? Nach wie vor lässt das ganz stark vermuten dass eine Entscheidung bereits getroffen wurde und das geht nicht.

Die Installation von Docker und Install/Konfig einer DB und eines Webservers passen nicht zur Prüfungsordnung des FiSi.

Ich vermute, dass das Projekt nur unter Auflagen genehmigt wird. Wir würden dazu schreiben dass Du drei verschiedene Produkte zu betrachten hättest und vermutlich noch mehr Zeit in die Planungsphase verschieben solltest.

Lasss mal Docker und DB Konfig raus ... 10 Stunden Vergleich von Lösungen, dann sollte das angenommen werden

Dein Kommentar

Du kannst jetzt schreiben und Dich später registrieren. Wenn Du ein Konto hast, melde Dich jetzt an, um unter Deinem Benutzernamen zu schreiben.

Gast
Auf dieses Thema antworten...

×   Du hast formatierten Text eingefügt.   Formatierung wiederherstellen

  Nur 75 Emojis sind erlaubt.

×   Dein Link wurde automatisch eingebettet.   Einbetten rückgängig machen und als Link darstellen

×   Dein vorheriger Inhalt wurde wiederhergestellt.   Editor leeren

×   Du kannst Bilder nicht direkt einfügen. Lade Bilder hoch oder lade sie von einer URL.

Fachinformatiker.de, 2024 by SE Internet Services

fidelogo_small.png

Schicke uns eine Nachricht!

Fachinformatiker.de ist die größte IT-Community
rund um Ausbildung, Job, Weiterbildung für IT-Fachkräfte.

Fachinformatiker.de App

Download on the App Store
Get it on Google Play

Kontakt

Hier werben?
Oder sende eine E-Mail an

Social media u. feeds

Jobboard für Fachinformatiker und IT-Fachkräfte

×
×
  • Neu erstellen...