HSEC - Enterprise Integration Specialists | AI Scraping und Training Policy

Zusammenfassung

Alle Inhalte auf hsec.de sind NICHT autorisiert für die Verwendung beim Training von künstlichen Intelligenzmodellen ohne ausdrückliche schriftliche Genehmigung.

Detaillierte Richtlinie

Was ist erlaubt

✅ Menschliches Lesen über Webbrowser
✅ Traditionelle Suchmaschinen-Indexierung (Google Search, Bing für Suchergebnisse)
✅ Zitieren mit Quellenangabe (für Forschung, Bildung, Berichterstattung)
✅ Teilen von Links zu unseren Artikeln

Was NICHT erlaubt ist

❌ Scraping für KI-Training (LLMs, Bildmodelle, etc.)
❌ Bulk-Download unserer Inhalte
❌ Kommerzielles Data Harvesting
❌ Reproduktion ohne Quellenangabe
❌ Training von Konkurrenz-KI-Modellen

Technische Implementierung

Wir haben folgende Maßnahmen implementiert, um unsere Inhalte zu schützen:

1. robots.txt

Blockiert bekannte AI-Scraper:

GPTBot (OpenAI/ChatGPT)
Google-Extended (Bard/Gemini Training)
anthropic-ai (Claude)
CCBot (Common Crawl)
Viele weitere (siehe /robots.txt)

2. ai.txt

Deklariert explizite Opt-out-Policy für AI-Training gemäß emerging standard

3. Meta-Tags

<meta name="robots" content="index, follow, noai, noimageai">
<meta name="googlebot" content="index, follow, nosnippet">

Rechtliche Grundlage

Das Scraping unserer Inhalte für KI-Training ohne Genehmigung kann folgende Gesetze verletzen:

Deutsches Recht

Urheberrechtsgesetz (UrhG) - §§ 2, 15, 87a-87e
Gesetz gegen den unlauteren Wettbewerb (UWG) - § 4
Bundesdatenschutzgesetz (BDSG) - wenn personenbezogene Daten betroffen sind

EU-Recht

EU-Urheberrechts-Richtlinie (2019/790) - Text and Data Mining (TDM)
DSGVO (Datenschutz-Grundverordnung) - Art. 6, 9, 21
Database Directive (96/9/EC) - Schutz von Datenbanken

Wichtige Rechtsprechung

Text and Data Mining Exception (EU): Die EU-Urheberrechts-Richtlinie erlaubt TDM für wissenschaftliche Forschung, ABER:

Kommerzielle KI-Trainingszwecke fallen NICHT darunter
Rechteinhaber können TDM ausdrücklich untersagen (was wir hiermit tun)
Opt-out muss “in einer maschinenlesbaren Form” erfolgen (robots.txt, ai.txt)

Warum wir AI-Scraping blockieren

1. Schutz geistigen Eigentums

Unsere technischen Dokumentationen, Insights, Fallstudien und Methodologien repräsentieren jahrelange proprietäre Expertise. Diese kostenlos für Menschen bereitzustellen ist Teil unseres Bildungsauftrags, aber Bulk-Scraping für KI-Training ohne Kompensation verletzt unsere Urheberrechte.

2. Wettbewerbsvorteile erhalten

Unsere spezifischen Ansätze, Analysen und Problemlösungsstrategien sind Teil unseres Wettbewerbsvorteils. KI-Modelle, die auf unseren Inhalten trainiert werden, könnten diese Expertise ohne Anerkennung reproduzieren.

3. Kontrolle über Datenverwendung

Als DSGVO-konformes Unternehmen nehmen wir Datenkontrolle ernst. Dies gilt auch für unsere eigenen Inhalte.

4. Fairness und Kompensation

Wenn unsere Inhalte kommerziellen KI-Modellen Wert hinzufügen, sollten wir dafür fair kompensiert werden.

Lizenzierung für KI-Training

Organisationen, die an der Lizenzierung unserer Inhalte für KI-Training-Zwecke interessiert sind, sollten uns kontaktieren:

Kontakt: info@hsec.de
Betreff: “AI Training Licensing Inquiry”

Wir bieten folgende Lizenzoptionen:

Forschungs-/Bildungslizenz

Für nicht-kommerzielle wissenschaftliche Forschung
Mit Quellenangabe und Anerkennung
Kostenlos oder vergünstigte Gebühr

Kommerzielle Lizenz

Für kommerzielle KI-Modellentwicklung
Verhandelbare Gebühren basierend auf Nutzungsumfang
Schriftlicher Lizenzvertrag erforderlich

White-Label-Lizenz

Vollständige Nutzungsrechte für spezifische Inhalte
Anpassung an Ihre Bedürfnisse
Premium-Preisgestaltung

Durchsetzung

Wir überwachen aktiv für unauthorized scraping durch:

1. Server-Log-Analyse

Identifizierung verdächtiger Traffic-Muster (hohe Request-Raten, bekannte Bot User-Agents)

2. Rate Limiting

Automatische Drosselung von Bots, die unsere Server überlasten

3. IP-Blocking

Blockierung bekannter AI-Scraper-IP-Ranges

4. Legal Action

Bei schweren Verstößen:

Cease-and-Desist-Schreiben
Schadensersatzforderungen
Gerichtliche Unterlassungsklagen

Ausnahmen

Attribution-basierte Nutzung

Sie dürfen kurze Auszüge (< 250 Wörter) mit vollständiger Quellenangabe verwenden:

Format:

Quelle: HSEC - Helmut Hauschild Software Engineering and Consulting
Titel: [Artikeltitel]
URL: https://hsec.de/[Pfad]
Abrufdatum: [Datum]

Fair Use / Zitatrecht

Kurze Zitate für Kritik, Kommentar, Berichterstattung oder Lehre sind gemäß deutschem Zitatrecht (UrhG § 51) erlaubt, aber:

Muss klar als Zitat gekennzeichnet sein
Quellenangabe erforderlich
Umfang muss angemessen sein
Gilt NICHT für Bulk-Scraping

Häufig gestellte Fragen (FAQ)

Warum blockieren Sie Google-Extended, aber nicht Googlebot?

Googlebot indexiert für die Google-Suche (hilft Menschen, unsere Inhalte zu finden).
Google-Extended scraped für Bard/Gemini-KI-Training (kein direkter Nutzen für uns).

Können Forscher Ihre Inhalte für akademische Studien verwenden?

Ja, mit Quellenangabe und für nicht-kommerziellen Gebrauch. Für größere Studien kontaktieren Sie uns bitte für eine Forschungslizenz.

Wie kann ich wissen, ob mein Tool Ihre Inhalte scrapen darf?

Wenn Ihr Tool die robots.txt respektiert und NICHT für KI-Training verwendet wird, ist es wahrscheinlich in Ordnung. Im Zweifel: Fragen Sie uns!

Gilt dies für AI-generierte Bilder auf Ihrer Seite?

Unsere AI-generierten Hintergrundbilder sind ebenfalls urheberrechtlich geschützt (als Werke, die wir erstellt haben). Sie dürfen nicht ohne Genehmigung geschraped werden.

Was passiert, wenn AI-Bots robots.txt ignorieren?

Das stärkt unseren rechtlichen Anspruch. Robots.txt ist eine “deutliche Willenserklärung”, die vor Gericht Gewicht hat.

Änderungen dieser Richtlinie

Wir behalten uns vor, diese Richtlinie zu aktualisieren, wenn neue AI-Scraper auftauchen oder sich rechtliche Standards ändern.

Aktuelle Version: 1.0
Stand: 1. Februar 2026
Letzte Aktualisierung: 1. Februar 2026

Kontakt

Bei Fragen zu dieser Richtlinie oder Lizenzanfragen:

E-Mail: info@hsec.de
Betreff: “AI Scraping Policy”

Rechtlicher Hinweis: Diese Richtlinie ist rechtlich bindend. Zuwiderhandlung kann zivilrechtliche und strafrechtliche Folgen haben.