Skip to content

Commit c6f3ca0

Browse files
committed
📝 Update licensing
1 parent dc45759 commit c6f3ca0

File tree

1 file changed

+127
-44
lines changed

1 file changed

+127
-44
lines changed

docs/productive/licensing.rst

Lines changed: 127 additions & 44 deletions
Original file line numberDiff line numberDiff line change
@@ -88,9 +88,8 @@ Allgemeinheit über. Zur Kennzeichnung der Gemeinfreiheit von Software wurde die
8888
Nicht-Software-Lizenzen
8989
-----------------------
9090

91-
Open-Source-Software-Lizenzen können auch für Werke verwendet werden, die nicht
92-
Software sind. Oft sind sie auch die beste Wahl, insbesondere wenn die
93-
betreffenden Werke als Quelltext bearbeitet und versioniert werden.
91+
Open-Source-Software-Lizenzen werden häufig auch für Werke verwendet, die nicht
92+
Software sind. Oft sind sie jedoch nicht die beste Wahl.
9493

9594
Daten, Medien, etc.
9695
~~~~~~~~~~~~~~~~~~~
@@ -105,46 +104,53 @@ Datensätzen bis zu Videos. Sie sind jedoch `nicht für Software empfohlen
105104
.. _deal:
106105

107106
.. tip::
108-
Das `DEAL-Konsortium <https://deal-konsortium.de>`_ empfiehlt für
109-
Open-Access-Veröffentlichungen die CC BY-Lizenz, :abbr:`s.a. (siehe auch)`
110-
`Warum CC BY die beste Wahl für Open-Access-Publikationen ist
111-
<https://deal-konsortium.de/warum-ccby>`_.
112-
113-
Das :abbr:`RADAR (Research Data Repository)`, ein disziplinübergreifendes
114-
Repository zur Archivierung und Veröffentlichung von Forschungsdaten
115-
empfiehlt hingegen nur eine der `CC-Lizenzen
116-
<https://radar.products.fiz-karlsruhe.de/de/radarfeatures/lizenzen-fuer-forschungsdaten#cc-lizenzen>`_.
117-
118-
Die `Open Knowledge Foundation <https://okfn.org/en/>`_ hat ebenfalls eine Reihe
119-
von `Open Data Commons <https://opendatacommons.org>`_-Lizenzen für
120-
Daten/Datenbanken veröffentlicht:
121-
122-
`Open Data Commons Open Database License (ODbL) v1.0 <https://opendatacommons.org/licenses/odbl/1-0/>`_
123-
Namensnennung und Weitergabe unter gleichen Bedingungen.
124-
`Open Data Commons Attribution License (ODC-By) v1.0 <https://opendatacommons.org/licenses/by/1-0/>`_
125-
Namensnennung.
126-
`Open Data Commons Public Domain Dedication and License (PDDL) v1.0 <https://opendatacommons.org/licenses/pddl/1-0/>`_
127-
Die PDDL stellt die Daten in den öffentlichen Bereich und verzichtet auf
128-
alle Rechte.
129-
130-
`GovData <https://www.govdata.de>`_ hat die *Datenlizenz Deutschland* in zwei
131-
Varianten vorgelegt:
132-
133-
* `Datenlizenz Deutschland – Namensnennung – Version 2.0
134-
<https://www.govdata.de/dl-de/by-2-0>`_
135-
* `Datenlizenz Deutschland – Zero – Version 2.0
136-
<https://www.govdata.de/dl-de/zero-2-0>`_
137-
138-
Bei der Verwendung des `Community Data License Agreement – Permissive, Version 2.0 <https://cdla.dev/permissive-2-0/>`_ müssen die Urheberrechtshinweise
139-
beibehalten werden.
140-
141-
Eine weitere mögliche Lizenz für künstlerische Werke ist die `Free Art License
142-
1.3 <https://artlibre.org/licence/lal/en/>`_.
107+
* Das `DEAL-Konsortium <https://deal-konsortium.de>`_ empfiehlt für
108+
Open-Access-Veröffentlichungen von Forschungsergebnissen die CC BY-Lizenz,
109+
:abbr:`s.a. (siehe auch)` `Warum CC BY die beste Wahl für
110+
Open-Access-Publikationen ist <https://deal-konsortium.de/warum-ccby>`_.
111+
* Das :abbr:`RADAR (Research Data Repository)`, ein disziplinübergreifendes
112+
Repository zur Archivierung und Veröffentlichung von Forschungsdaten
113+
empfiehlt hingegen nur eine der `CC-Lizenzen
114+
<https://radar.products.fiz-karlsruhe.de/de/radarfeatures/lizenzen-fuer-forschungsdaten#cc-lizenzen>`_.
115+
116+
* Die `Open Knowledge Foundation <https://okfn.org/en/>`_ hat ebenfalls eine
117+
Reihe von `Open Data Commons <https://opendatacommons.org>`_-Lizenzen für
118+
Daten/Datenbanken veröffentlicht:
119+
120+
`Open Data Commons Open Database License (ODbL) v1.0 <https://opendatacommons.org/licenses/odbl/1-0/>`_
121+
Namensnennung und Weitergabe unter gleichen Bedingungen.
122+
`Open Data Commons Attribution License (ODC-By) v1.0 <https://opendatacommons.org/licenses/by/1-0/>`_
123+
Namensnennung.
124+
`Open Data Commons Public Domain Dedication and License (PDDL) v1.0 <https://opendatacommons.org/licenses/pddl/1-0/>`_
125+
Die PDDL stellt die Daten in den öffentlichen Bereich und verzichtet auf
126+
alle Rechte.
127+
128+
* `GovData <https://www.govdata.de>`_ hat die *Datenlizenz Deutschland* in zwei
129+
Varianten vorgelegt:
130+
131+
* `Datenlizenz Deutschland – Namensnennung – Version 2.0
132+
<https://www.govdata.de/dl-de/by-2-0>`_
133+
* `Datenlizenz Deutschland – Zero – Version 2.0
134+
<https://www.govdata.de/dl-de/zero-2-0>`_
135+
136+
* Das `Community Data License Agreement <https://cdla.dev>`_ kann in vier
137+
verschiedenen Varianten genutzt werden:
138+
139+
* `Community Data License Agreement – Permissive, Version 2.0
140+
<https://cdla.dev/permissive-2-0/>`_
141+
* `Community Data License Agreement – Sharing, Version 1.0
142+
<https://cdla.dev/sharing-1-0/>`_
143+
* `Open Use of Data Agreement, Version 1.0
144+
<https://cdla.dev/open-use-of-data-agreement-v1-0/>`_
145+
* `Computational Use of Data Agreement, Version 1.0
146+
<https://cdla.dev/computational-use-of-data-agreement-v1-0/>`_
147+
148+
* Eine weitere mögliche Lizenz für künstlerische Werke ist die `Free Art License
149+
1.3 <https://artlibre.org/licence/lal/en/>`_.
143150

144151
Machine Learning-Modelle
145152
~~~~~~~~~~~~~~~~~~~~~~~~
146153

147-
148154
Es ist eine offene Frage, ob :abbr:`KI (Künstliche Intelligenz)`/:abbr:`ML
149155
(Machine Learning)`-Modellgewichte überhaupt urheberrechtsfähig sind. Das
150156
US-Urheberrechtsgesetz schließt ausdrücklich *„jede Idee, jedes Verfahren, jeden
@@ -171,22 +177,99 @@ bestimmte Modelle entwickelt wurden:
171177
<https://github.com/facebookresearch/metaseq/blob/main/projects/OPT/MODEL_LICENSE.md>`_
172178
* `BigScience BLOOM RAIL v1.0
173179
<https://bigscience.huggingface.co/blog/the-bigscience-rail-license>`_
174-
* `BigScience OpenRAIL-M (Responsible AI License
175-
<https://www.licenses.ai/blog/2022/8/26/bigscience-open-rail-m-license>`_
176180

177-
RAIL-D
181+
Es gibt noch weitere `Responsible AI Licenses (RAIL)
182+
<https://www.licenses.ai>`_ mit verschiedenen Nutzungsbeschränkungen:
183+
184+
OpenRAIL-D
178185
enthält Nutzungsbeschränkungen, die sich nur auf die Daten beziehen.
179-
RAIL-A
186+
OpenRAIL-A
180187
enthält Nutzungsbeschränkungen, die nur für die Anwendung/Ausführbarkeit
181188
gelten.
182-
RAIL-M
189+
OpenRAIL-M
183190
enthält Nutzungsbeschränkungen, die nur für das Modell gelten.
191+
192+
.. seealso::
193+
`RAIL-M
194+
<https://www.licenses.ai/blog/2022/8/26/bigscience-open-rail-m-license>`_
195+
184196
RAIL-S
185197
enthält Nutzungsbeschränkungen, die nur für den Quellcode gelten.
186198

199+
KI-Modelle, die zwar unter einer Open-Source-Lizenz stehen, deren Schulungsdaten
200+
und -Programme jedoch nicht veröffentlicht wurden, sind **nicht** konform mit
201+
den `Debian Free Software Guidelines (DFSG)
202+
<https://de.wikipedia.org/wiki/Debian_Free_Software_Guidelines>`_, :abbr:`s.a.
203+
(siehe auch)` `Interpretation of DFSG on Artificial Intelligence (AI) Models
204+
<https://www.debian.org/vote/2025/vote_002>`_.
205+
206+
.. _osaid:
207+
208+
Auch für die `Open Source Initiative (OSI) <https://opensource.org/>`__ geht die
209+
Definition von Open-Source-KI weit über die Verwendung eines Modells hinaus –
210+
es muss auch verständlich sein, wie das Modell erstellt wurde, und das Modell
211+
muss auch verändert und mit anderen geteilt für jeden Zweck geteilt werden
212+
können. Diese vier Freiheiten sind erfüllt mit
213+
214+
Open Data
215+
Ausreichend detaillierte Informationen über die zum Training des Systems
216+
verwendeten Daten, so dass ein im Wesentlichen gleichwertiges System
217+
aufgebaut werden kann.
218+
Open Code
219+
Der vollständige Quellcode, der für das Training und den Betrieb des Systems
220+
verwendet wird unter von der OSI genehmigten Lizenzen.
221+
Open Weights
222+
Modellparameter, wie :abbr:`z. B. (zum Beispiel)` Gewichte oder andere
223+
Konfigurationseinstellungen unter von der OSI genehmigten Lizenzen.
224+
225+
Die OSI entwickelte entsprechend `OSAID 1.0
226+
<https://opensource.org/ai/open-source-ai-definition>`_, die :abbr:`u.a. (unter
227+
anderem)` für folgende Modelle gilt:
228+
229+
* EleutherAI: `pythia <https://github.com/EleutherAI/pythia>`_, `GPT-J
230+
<https://www.eleuther.ai/artifacts/gpt-j>`_
231+
* The Allen Institute for Artificial Intelligence: `OLMo 2
232+
<https://allenai.org/olmo>`_, `Molmo <https://allenai.org/blog/molmo>`_
233+
* LLM360: `K2
234+
<https://huggingface.co/collections/LLM360/k2-6622ae6911e3eb6219690039>`_,
235+
`Amber
236+
<https://huggingface.co/collections/LLM360/amber-65e7333ff73c7bbb014f2f2f>`_,
237+
`CrystalCoder <https://huggingface.co/LLM360/Crystal>`_
238+
* Google: `T5
239+
<https://github.com/google-research/text-to-text-transfer-transformer>`_
240+
241+
Vermutlich würden auch die folgenden Modelle die Anforderungen erfüllen, wenn
242+
sie ihre rechtlichen Bedingungen ändern würden:
243+
244+
* BigScience: `Bloom <https://huggingface.co/bigscience/bloom>`_
245+
* BigCode: `StarCoder 2 <https://github.com/bigcode-project/starcoder2>`_
246+
* Technology Innovation Institute: `Falcon
247+
<https://huggingface.co/collections/tiiuae/falcon-h1-6819f2795bc406da60fab8df>`_
248+
249+
Es gibt jedoch auch einige Modelle, die analysiert wurden und nicht bestanden
250+
haben, weil ihnen erforderlichen Komponenten und/oder rechtlichen Vereinbarungen
251+
fehlen:
252+
253+
* Meta: Llama2
254+
* xAI: Grok
255+
* Microsoft: Phi-2
256+
* Mistral AI: Mixtral
257+
187258
.. seealso::
188259
* The Turing Way Community: `Licensing Machine Learning models
189260
<https://book.the-turing-way.org/reproducible-research/licensing/licensing-ml>`_
261+
* `Open Source AI <https://opensource.org/ai>`_
262+
* Alek Tarkowski, Open Future in Zusammenarbeit mit der Open Source
263+
Initiative: `Data Governance in Open Source AI
264+
<https://opensource.org/wp-content/uploads/2025/02/2025-OSI-DataGovernanceOSAI-final-v5.pdf>`_
265+
266+
Datenbanken
267+
~~~~~~~~~~~
268+
269+
Einige der wenigen Lizenzen für Datenbanken ist die `Open Data Commons Open
270+
Database License (ODbL) v1.0 <https://opendatacommons.org/licenses/odbl/1-0/>`_,
271+
die :abbr:`z.B. (zum Beispiel)` von `OpenStreetMap (OSM)
272+
<https://www.openstreetmap.org>`_ verwendet wird.
190273

191274
Dokumentation
192275
~~~~~~~~~~~~~

0 commit comments

Comments
 (0)