AI Scraping und Training Policy
Zusammenfassung
Alle Inhalte auf hsec.de sind NICHT autorisiert für die Verwendung beim Training von künstlichen Intelligenzmodellen ohne ausdrückliche schriftliche Genehmigung.
Detaillierte Richtlinie
Was ist erlaubt
✅ Menschliches Lesen über Webbrowser
✅ Traditionelle Suchmaschinen-Indexierung (Google Search, Bing für Suchergebnisse)
✅ Zitieren mit Quellenangabe (für Forschung, Bildung, Berichterstattung)
✅ Teilen von Links zu unseren Artikeln
Was NICHT erlaubt ist
❌ Scraping für KI-Training (LLMs, Bildmodelle, etc.)
❌ Bulk-Download unserer Inhalte
❌ Kommerzielles Data Harvesting
❌ Reproduktion ohne Quellenangabe
❌ Training von Konkurrenz-KI-Modellen
Technische Implementierung
Wir haben folgende Maßnahmen implementiert, um unsere Inhalte zu schützen:
1. robots.txt
Blockiert bekannte AI-Scraper:
- GPTBot (OpenAI/ChatGPT)
- Google-Extended (Bard/Gemini Training)
- anthropic-ai (Claude)
- CCBot (Common Crawl)
- Viele weitere (siehe /robots.txt)
2. ai.txt
Deklariert explizite Opt-out-Policy für AI-Training gemäß emerging standard
3. Meta-Tags
<meta name="robots" content="index, follow, noai, noimageai">
<meta name="googlebot" content="index, follow, nosnippet">
Rechtliche Grundlage
Das Scraping unserer Inhalte für KI-Training ohne Genehmigung kann folgende Gesetze verletzen:
Deutsches Recht
- Urheberrechtsgesetz (UrhG) - §§ 2, 15, 87a-87e
- Gesetz gegen den unlauteren Wettbewerb (UWG) - § 4
- Bundesdatenschutzgesetz (BDSG) - wenn personenbezogene Daten betroffen sind
EU-Recht
- EU-Urheberrechts-Richtlinie (2019/790) - Text and Data Mining (TDM)
- DSGVO (Datenschutz-Grundverordnung) - Art. 6, 9, 21
- Database Directive (96/9/EC) - Schutz von Datenbanken
Wichtige Rechtsprechung
Text and Data Mining Exception (EU): Die EU-Urheberrechts-Richtlinie erlaubt TDM für wissenschaftliche Forschung, ABER:
- Kommerzielle KI-Trainingszwecke fallen NICHT darunter
- Rechteinhaber können TDM ausdrücklich untersagen (was wir hiermit tun)
- Opt-out muss “in einer maschinenlesbaren Form” erfolgen (robots.txt, ai.txt)
Warum wir AI-Scraping blockieren
1. Schutz geistigen Eigentums
Unsere technischen Dokumentationen, Insights, Fallstudien und Methodologien repräsentieren jahrelange proprietäre Expertise. Diese kostenlos für Menschen bereitzustellen ist Teil unseres Bildungsauftrags, aber Bulk-Scraping für KI-Training ohne Kompensation verletzt unsere Urheberrechte.
2. Wettbewerbsvorteile erhalten
Unsere spezifischen Ansätze, Analysen und Problemlösungsstrategien sind Teil unseres Wettbewerbsvorteils. KI-Modelle, die auf unseren Inhalten trainiert werden, könnten diese Expertise ohne Anerkennung reproduzieren.
3. Kontrolle über Datenverwendung
Als DSGVO-konformes Unternehmen nehmen wir Datenkontrolle ernst. Dies gilt auch für unsere eigenen Inhalte.
4. Fairness und Kompensation
Wenn unsere Inhalte kommerziellen KI-Modellen Wert hinzufügen, sollten wir dafür fair kompensiert werden.
Lizenzierung für KI-Training
Organisationen, die an der Lizenzierung unserer Inhalte für KI-Training-Zwecke interessiert sind, sollten uns kontaktieren:
Kontakt: info@hsec.de
Betreff: “AI Training Licensing Inquiry”
Wir bieten folgende Lizenzoptionen:
Forschungs-/Bildungslizenz
- Für nicht-kommerzielle wissenschaftliche Forschung
- Mit Quellenangabe und Anerkennung
- Kostenlos oder vergünstigte Gebühr
Kommerzielle Lizenz
- Für kommerzielle KI-Modellentwicklung
- Verhandelbare Gebühren basierend auf Nutzungsumfang
- Schriftlicher Lizenzvertrag erforderlich
White-Label-Lizenz
- Vollständige Nutzungsrechte für spezifische Inhalte
- Anpassung an Ihre Bedürfnisse
- Premium-Preisgestaltung
Durchsetzung
Wir überwachen aktiv für unauthorized scraping durch:
1. Server-Log-Analyse
Identifizierung verdächtiger Traffic-Muster (hohe Request-Raten, bekannte Bot User-Agents)
2. Rate Limiting
Automatische Drosselung von Bots, die unsere Server überlasten
3. IP-Blocking
Blockierung bekannter AI-Scraper-IP-Ranges
4. Legal Action
Bei schweren Verstößen:
- Cease-and-Desist-Schreiben
- Schadensersatzforderungen
- Gerichtliche Unterlassungsklagen
Ausnahmen
Attribution-basierte Nutzung
Sie dürfen kurze Auszüge (< 250 Wörter) mit vollständiger Quellenangabe verwenden:
Format:
Quelle: HSEC - Helmut Hauschild Software Engineering and Consulting
Titel: [Artikeltitel]
URL: https://hsec.de/[Pfad]
Abrufdatum: [Datum]
Fair Use / Zitatrecht
Kurze Zitate für Kritik, Kommentar, Berichterstattung oder Lehre sind gemäß deutschem Zitatrecht (UrhG § 51) erlaubt, aber:
- Muss klar als Zitat gekennzeichnet sein
- Quellenangabe erforderlich
- Umfang muss angemessen sein
- Gilt NICHT für Bulk-Scraping
Häufig gestellte Fragen (FAQ)
Warum blockieren Sie Google-Extended, aber nicht Googlebot?
Googlebot indexiert für die Google-Suche (hilft Menschen, unsere Inhalte zu finden).
Google-Extended scraped für Bard/Gemini-KI-Training (kein direkter Nutzen für uns).
Können Forscher Ihre Inhalte für akademische Studien verwenden?
Ja, mit Quellenangabe und für nicht-kommerziellen Gebrauch. Für größere Studien kontaktieren Sie uns bitte für eine Forschungslizenz.
Wie kann ich wissen, ob mein Tool Ihre Inhalte scrapen darf?
Wenn Ihr Tool die robots.txt respektiert und NICHT für KI-Training verwendet wird, ist es wahrscheinlich in Ordnung. Im Zweifel: Fragen Sie uns!
Gilt dies für AI-generierte Bilder auf Ihrer Seite?
Unsere AI-generierten Hintergrundbilder sind ebenfalls urheberrechtlich geschützt (als Werke, die wir erstellt haben). Sie dürfen nicht ohne Genehmigung geschraped werden.
Was passiert, wenn AI-Bots robots.txt ignorieren?
Das stärkt unseren rechtlichen Anspruch. Robots.txt ist eine “deutliche Willenserklärung”, die vor Gericht Gewicht hat.
Änderungen dieser Richtlinie
Wir behalten uns vor, diese Richtlinie zu aktualisieren, wenn neue AI-Scraper auftauchen oder sich rechtliche Standards ändern.
Aktuelle Version: 1.0
Stand: 1. Februar 2026
Letzte Aktualisierung: 1. Februar 2026
Kontakt
Bei Fragen zu dieser Richtlinie oder Lizenzanfragen:
E-Mail: info@hsec.de
Betreff: “AI Scraping Policy”
Rechtlicher Hinweis: Diese Richtlinie ist rechtlich bindend. Zuwiderhandlung kann zivilrechtliche und strafrechtliche Folgen haben.