Version: 1.0.0
Dies ist das XML-Schema für die Archivierung von Studierendendaten, dass im Rahmen des Projekts «Digital Campus» an der ETH Zürich entwickelt wurde. Das Schema basiert auf dem XML-Schema von nestor zur «Archivierung von Studierendendaten aus Fachverfahren - Version 1.0» (urn:nbn:de:0008-2023060507), wurde an Schweizer Gegebenheiten angepasst und erfüllt alle erforderlichen Best Practices von eCH-0018. Es ermöglicht das Erzeugen von Studierenden-Dossiers für die Archivierung, entsprechend enthalten die Dossiers nur Angaben, die für die Archivierung relevant sind. Neben den Angaben in der XML-Datei werden normalerweise auch zusätzliche Dokumente (meist als PDF) mitarchiviert.
In diesem Repositorium findet sich:
- Das XML-Schema als XSD-Datei
- Dieses Readme, welche das Schema und deren Nutzung beschreibt
- Beispieldateien von XML-Dateien, die dem Schema folgen
Hinweise zur Mitarbeit an diesem Projekt finden sich in der CONTRIBUTING.md.
Im Ordner «Beispieldateien» finden sich zwei Beispiele. Die XML-Datei alle-elemente.xml beinhaltet jedes erlaubte Elemente mindestens einmal und ein xsi:schemaLocation-Attribut, während die XML-Datei pflichtelemente.xml nur alle Pflichtelemente enthält und kein xsi:schemaLocation-Attribut. Die Beispieldateien dienen nur zur Veranschaulichung und bilden selbst nicht zwingend ein plausibles oder vollständiges Studierendendossier ab. Zu beachten ist ebenfalls, dass das Element anschriften nicht vorgibt, dass ein Element heimatanschrift oder semesteranschrift Pflicht ist, allerdings sollte effektiv mindestens eines dieser Elemente vorhanden sein.
XML-Dateien können auf zwei Ebenen auf ihre syntaktische Korrektheit überprüft werden. Eine wohlgeformte XML-Datei (well-formed) hält die grundsätzlichen Regeln von XML ein, während eine gültige XML-Datei (valid) sich zusätzlich an ein vorgegebenes Schema hält. Ein XML-Schema deklariert, welche Datenelemente in einer XML-Datei vorhanden sein dürfen und wie diese strukturiert sind. Durch diese Vorgaben kann sichergestellt werden, dass ein XML nur Daten enthält, die vom Schema her zu erwarten sind. Beim Erstellen einer XML-Datei muss sich an das vorgegebene Schema gehalten werden. Das Schema kann zusätzlich mit einem Validator genutzt werden, die XML-Dateien auf ihre Gültigkeit zu prüfen. Im Ordner «Beispieldateien» findet sich eine Sammlung von gültigen XML-Dateien.
Nach eCH-0018 sollte auf das xsi:schemaLocation-Attribut verzichtet werden und die Identifikation des Schemas nur über den Namespace-Namen erfolgen. Werden die XML-Dateien aber in standardisierten Dossiers geliefert, in denen auch die XSD-Schemadatei standardmässig abgelegt ist, kann eine Referenz auf die lokale XSD-Datei mit dem xsi:schemaLocation-Attribut in der XML-Datei im Rahmen der Archivierung sinnvoll sein, um künftige Validierungen zu vereinfachen.
Das Kompetenznetzwerk Langzeitarchivierung und Langzeitverfügbarkeit digitaler Ressourcen in Deutschland e.V. «nestor» hat 2023 Materialien zur Archivierung von Studierendendaten aus Fachverfahren veröffentlicht. Sie beschreiben ein Vorgehen, wie Studierendendaten aus Fachverfahren archiviert werden können. Zu diesen Materialien gehört auch ein Muster für ein XML-Schema urn:nbn:de:0008-2023050314. Dieses ist explizit als Muster erstellt worden und nicht als endgültigen Standard. So sind Doktorierende im Muster-Schema nicht abgedeckt und zudem gibt es Unterschiede zum Schweizer (Bildungs-)System. Aus diesem Grund hat die ETH-Bibliothek das Muster als Grundlage genommen, um ein eigenes Schema zu entwickeln. In diesem Rahmen wurde das XML-Schema zusätzlich an die erforderlichen Best Practices von eCH-0018 angepasst. Es wurde versucht, das Schema allgemeingültig zu halten, damit es auch von anderen Schweizer Institutionen genutzt werden könnte.
- Definitionen von Complex Types wurde «Type» hinzugefügt (Kapitel 3.2)
- Für Elemente, deren Sprache im nestor-Standard mit dem
xml:lang-Attribut deklariert sind, wurden stattdessen eigene Elemente (Value-Pair) eingeführt (Kapitel 3.7.2). Das Element wurde in diesem Zuge meist ebenfalls leicht angepasst und unique-Constrains, die sich auf diese Elemente bezogen haben wurden entfernt.
- Das Element
kuenstler_ordensnamewurde zuabweichenderNamegeändert, um flexibler nutzbar zu sein. - Das Element
fruehererNamewurde dem Elementnamehinzugefügt, um Namensänderungen erfassbar zu machen. - Das Element
fruehereGeschlechterwurde dem ElementPersonenstammdatenTypehinzugefügt, um Geschlechtsänderungen erfassbar zu machen. - Das Element
geburtsortwurde optional gemacht, da bei Personen mit Schweizer Staatsbürgerschaft stattdessen der Heimatort erfasst wird. - Im Element
geburtsortwurde statt dem Elementortdas Elementlandverpflichtend gemacht, da der Geburtsort vermutlich nur bei Personen ohne Schweizer Staatsbürgerschaft erfasst wird. - Das Element
heimatortewurde dem ElementPersonenstammdatenTypehinzugefügt. - Das Element
herkunftslandwurde dem ElementPersonenstammdatenTypehinzugefügt, damit das Herkunftsland vom Geburtsland unterschieden werden kann. - Das Element
familienstandwurde zuzivilstandumbenannt, da dies die Schweizerische Bezeichnung ist. - Das Element
religionszugehoerigkeitwurde entfernt, da diese Angabe in der Schweiz nicht erhoben wird. - Dem Element
hochschulzulassungsberechtigungwurden die Elementematuratypundschulehinzugefügt.
- Das Element
studiensemesterwurde wiederholbar gemacht. - Das Element
semesterwochenstundenwurde dem Elementstudiensemesterhinzugefügt. - Das Element
hoerstatuswurde aufhoererstatusumbenannt. - Das Element
finanzierungwurde dem Elementstudiensemesterhinzugefügt, um Stipendien oder die Selbstfinanzierung bei Doktorierenden zu erfassen.
- Das Element
studienabteilungwurde dem Elementstudienganghinzugefügt, damit darin dasdepartement, diefakultaetoder dasinstituterfasst werden kann. - Das Element
geltendeDoktoratsverordnungwurde dem Elementstudienganghinzugefügt. - Das Element
auszeichnungenwurde dem Elementleistunghinzugefügt. - Das Element
doktorarbeitwurde dem Elementleistunghinzugefügt, in dem spezifische Angaben zu Doktorarbeiten erfasst werden können.
- Das Element
HeimatortTypewurde hinzugefügt, um den Heimatort von Personen mit Schweizer Staatsbürgerschaft zu erfassen. - Das Element
DoktorarbeitTypewurde hinzugefügt, welches spezifische Angaben zu Doktorarbeiten erfasst. - Das Element
StudiengangTypewurde hinzugefügt, um die Sprache als eigenes Element zu erfassen. - Das Element
FachrichtungTypewurde hinzugefügt, um die Sprache als eigenes Element zu erfassen. - Das Element
AnschriftStudwurde entfernt, da die Unterscheidung von der Heimatanschrift und Semesteranschrift nicht über Attribute gelöst wird, sondern über zwei separate Elemente. - Das Element
GeldbetragTypewurde hinzugefügt, um Geldbeträge im Elementfinanzierungzu erfassen. - Das Element
NonEmptyWithLangwurde entfernt, da die Sprachkennzeichnung nicht über Attribute gelöst wird.
- Die Elemente
landkreiswurden aufkantonumbenannt. - Das Element
anschriftenszusatzwurde im Complex TypeAnschriftTypeaufadresszusatzumbenannt.
Dieses Schema folgt Semantic Versioning (Major.Minor.Patch). Die aktuelle Version ist im version-Attribut des xsd:schema-Elements sowie in diesem README dokumentiert. Releases werden als Git-Tags (v1.0.0, v1.1.0, ...) erstellt.
Gemäss eCH-0018 enthält die Namespace-URI nur die Major-Version:
https://schemas.library.ethz.ch/xmlns/studierendendaten/1
Die Namespace-URI ändert sich nur bei einem Major-Versionssprung (z.B. von /1 auf /2). Minor- und Patch-Versionen behalten dieselbe Namespace-URI, da bestehende XML-Dokumente weiterhin gültig bleiben.
| Versionssprung | Namespace-URI | Beispiel |
|---|---|---|
| Patch (1.0.0 → 1.0.1) | bleibt /1 |
Korrektur in der Dokumentation, Tippfehler in xsd:documentation |
| Minor (1.0.0 → 1.1.0) | bleibt /1 |
Neues optionales Element (z.B. emailAdresse), neuer optionaler ComplexType, Lockerung einer Einschränkung (z.B. minOccurs="1" → minOccurs="0") |
| Major (1.0.0 → 2.0.0) | wird /2 |
Entfernung oder Umbenennung eines Elements, Verschärfung einer Einschränkung (z.B. minOccurs="0" → minOccurs="1"), Änderung der Elementreihenfolge |
Ein Major-Versionssprung bedeutet, dass bestehende XML-Dokumente möglicherweise nicht mehr gültig sind. Solange bestehende Dokumente weiterhin validieren, bleibt die Namespace-URI unverändert.