Technische Schnittstellen für eine Wissensdatenbank

Thomas1989

Newbie
Registriert
Nov. 2014
Beiträge
1
Hallo zusammen,

meine Aufgabe ist es, eine Datenbank mit Informationsquellen zu befüllen.

Auf der Datenbank sollen wichtige Daten, z.B. in PDF, DOC, PP – Format abgelegt werden. Die Datenbank soll anschließend als Art „Google-Suchmaschine" fungieren und je nach gesuchtem Thema die richtigen Dateien anzeigen, auf die man zugleich auch zugreifen kann.

Die Datenbank gibt es bisher nicht. Sie ist auch erst mal zweitrangig!!!!

Wichtig für mich ist es zu wissen, wie Daten in eine Datenbank eingebunden werden. Das heißt, der Fokus meiner Arbeit soll auf den technischen Schnittstellen liegen.

Kann ich generell Daten in der Datenbank ablegen?

Falls ja, ist das überhaupt sinnvoll? Es sollen viele Daten dort abgelegt werden.

Ist es möglich, dass sich die Daten auf der Datenbank aktualisieren, wenn sich auch die Quelle aktualisiert? (Automatische Aktualisierung der Datenbank)

Oder muss hier jemand manuell die Datenbank pflegen?

Kann ich mir in meiner Datenbank anzeigen lassen, wann eine Aktualisierung der Quelle erfolgt ist?

Welche technischen Möglichkeiten gibt es, die Daten in eine Datenbank einzubinden? (technische Schnittstellen)


Ich bin nicht vom Fach und habe leider keine Ahnung inwiefern die Aufgabe umsetzbar ist und wie ich vorgehen muss.

Kann jemand weiterhelfen?

Vielen Dank im Voraus!!!

Thomas
 
Aber... in eine Datenbank legst du keine "Daten" ab... also keine PDF's oder sonswie gearteten Datein. In der Datenbank steht wo du die Daten auf dem NAS / Fileserver findest.
In einem ganz simplen Rahmen macht das di Windows Indizierung und die Windows Dateisuche.
 
Hi Thomas1989,
das hängt ganz vom Datenbanksystem ab, was da gespeichert wird. Moderne Systeme z.B. nonsql-Datenbanken können sich mit den notwendigen Zugriffsmechanismen auf die Quellen der Inhalte selbst auf dem neusten Stand halten.
Unterschätze nicht den Aufwand diese Aufgabe zu bewältigen. Wieviele Quellen sollen angezapft werden und zusammengeführt werden?
Die vorhergehende Rechere verlangt eine gute Abwägung zum anfallenden Aufwand.
Wichtig sind eine gute Kenntnis und Auswahl der Datenbanksoftware und der Umgebung, Tools zum befüllen und die notwendigen Regeln dazu. Nicht zu vergessen große Speicher, hohe Rechenpower und sehr schnelle Anbindung ans Netz, ich nehme an das soll alles immer topaktuell sein.
Also viel Arbeit und viel Spaß dabei.
Ich kann das aus langer Erfahrung mit Datenbanksystemen so in die Diskussion stellen.
Große Aufgabe!
 
Ein mögliches Datenbanksystem mit Frontend wäre hier Microsoft Sharepoint. Das basiert auf dem Microsoft SQL Server und legt alles in dieser Datenbank ab. Dokumente können dort auch versioniert werden, also Änderungen mit Historie gespeichert werden.

Sharpoint hat auch einen selbst beeinflussbaren Suchindex.

Kostenlos (sofern man eine Windows Server Lizenz hat) ist hier die kleinste Version "Sharepoint Foundation 2013".

Siehe auch: http://de.wikipedia.org/wiki/SharePoint
 
Du willst im Prinzip ein CM-System bzw. DMS haben (Content Management oder Document Management System). Das ist ist nicht so ganz trivial, weil es einerseits zig verschiedene Ansätze gibt, und entsprechend auch zig verschiedenen Lösungen. Da gibt es einige OpenSource-Produkte, und natürlich auch zig kommerzielle Produkte. In welche Richtung soll es den gehen?

Ich kann Dir nur aus Erfahrung sagen, für beides braucht man eine Menge Zeit und gute Planung. Du solltest Dir erst mal ein Lasten/Pflichtenheft erstellt, wo Du die genauen Anforderungen erstellst, was sie leisten muß, und welche Schnittstellen erforderlich sind. Hier einen Profi zu engagieren ist kein Fehler.
 
Zuletzt bearbeitet:
PHuV schrieb:
Ich kann Dir nur aus Erfahrung sagen, für beides braucht man eine Menge Zeit und gute Planung. Du solltest Dir erst mal ein Lasten/Pflichtenheft erstellt, wo Du die genauen Anforderungen erstellst, was sie leisten muß, und welche Schnittstellen erforderlich sind. Hier einen Profi zu engagieren ist kein Fehler.

Genau so geht das. Insbesondere wenn man kein Vorwissen hat sollte man sich da gut überlegen, insbesondere wenn "wichtige Daten" gehandhabt werden kann das für schmerzhafte Erfahrungen sorgen ;)
 
Das erste Stichwort was mir eingefallen ist: Dokumenten Management System. Gibts es so einige am Markt, eventuell bis hin zu einem kompletten Groupware-System für gemeinsames Arbeiten wie das schon erwähnte MS Sharepoint. Arbeiten tun die unterliegend alle mit einer relationalen Datenbanken, welche zumindest die Metadaten erfasst. Ob da dann die Doks nur verlinkt werden (also physisch irgendwo im Dateisystem liegen) oder als Large Objects direkt integriert werden, ist dann noch eine andere Frage. Die Metadaten müssen aber so oder so gepflegt werden, ggf. bringt ein DMS bereits eine Art Auto-Indizierung mit.

Als kleine Schulaufgabe mit überschaubaren Dokumenten könnte man sich vielleicht mal den Kopf über eine eigene Datenbanklösung plus Mechanismen zu Metadatenerfassung und -pflege mal machen, bei handfesten Datenbeständen mit dem Fokus auf die inhaltliche Aufbereitung sollte man vielleicht erstmal eine Recherche zu DMS-Software machen.
 
Du hast im Prinzip Recht. Aber schau mal auf den IBM Content Manager, das ist im Prinzip ein CMS und ein DMS. ;) Die kommerziellen Produkte vermengen das, und die Grenzen verschwimmen hier.
 
Zuletzt bearbeitet:
Naja
Das sind ja auch recht freie Begriffe...
Aber allein vom internen Aufbau unterscheiden sich kommerzielle CMS und DMS schon enorm
(Ich meine "richtige" DMS wie zB das von SER)
Einem DMS sind ja auch ganz andere Anforderungen gestellt, die nicht alle CMS mit sich bringen.
 
Richtig. Wie andere und ich bereits sagten, das Thema ist komplex, und nicht mal so nebenbei erledigt. Kunden bezahlen ja uns (teuer) dafür, daß wir das für sie machen.
 
Zurück
Oben