Wie große Textdatei nach mehreren Kriterien durchsuchen und analysieren?

shortrange

Banned
Registriert
Okt. 2013
Beiträge
626
Hallo zusammen,

vielen Dank vorab schon mal für Eure Hilfe. Es geht um eine ca. 1,6GB große Textdatei bzw. XML-Datei, welche nach bestimmten Zeichen durchsucht und analysiert werden soll.

Kurz zur Vorgeschichte: Auf der Arbeit hatten wir ein firmeninternes MediaWiki im Intranet. In diesem Wiki wurden Anleitungen, Tipps und Dokumentationen zu firmeninternen Dingen gesammelt, aber auch Diskussionen geführt, Benutzerseiten erstellt, etc. Dieses Wiki war sehr unübersichtlich und chaotisch. Vor knapp zwei Wochen war das Wiki nicht mehr erreichbar und kurz darauf erhielten wir die Meldung, dass der Server durch einen Hardwaredefekt irreparabel beschädigt worden ist und somit auch sämtliche Daten im Wiki vorloren sind. Nun zur guten Nachricht: Ein Kollege hat einen recht aktuellen "Dump" des Wikis auftreiben können.

Meine Aufgabe ist es, die unübersichtlichen Inhalte im Wikidump, also in der XML-Datei, zu durchsuchen und zu ordnen, jedoch weiß ich nicht, wie ich das machen soll und brauche deshalb Eure Hilfe.

Der Dump ist beispielsweise wie folgt aufgebaut, Kommentare sind in eckigen Klammern beigefügt ([Kommentar]):
Code:
<page>
[weitere Tags wie <ns>, <id>, <revision>, etc.]
<title>Hinweise zur Bedienung der Maschine in Raum B2.08</title>
<text>Bei der Maschine in Raum B2.08 handelt es sich um eine '''[Modellname und Modellnummer]'''.

== Inbetriebnahme ==
Bei der Inbetriebnahme ist auf [...] zu achten.

== Beim Arbeiten zu beachten ==
[...]

== Ausschalten ==
[...]

== Ansprechpartner ==
Für die Maschine zuständig ist Max Mustermann.

=== Ansprechpartner 2 ===
Falls Max Mustermann nicht erreichbar oder verfügbar ist, bitte Melanie Mustermann fragen.
</page>
<page>
<title>Hinweise zur Bedienung der Maschine in Raum B2.09</title>
<text>Bei der Maschine in Raum B2.09 handelt es sich um eine '''[Modellname und Modellnummer]'''.

== Inbetriebnahme ==
Bei der Inbetriebnahme ist auf [...] zu achten.

== X0D5 Beim Arbeiten zu beachten ==
[...]

== Ausschalten ==
[...]

== Ansprechpartner ==
Für die Maschine zuständig ist Max Mustermann.

=== Ansprechpartner 2 ===
Falls Max Mustermann nicht erreichbar oder verfügbar ist, bitte Melanie Mustermann fragen.
</page>

Jetzt möchte ich beispielsweise alle Artikel nach dem Begriff "Max Mustermann" durchsuchen und die Suchausgabe soll mir den Title (=Inhalt der title-Tags) ausgeben. Wie kann ich das machen?

Danke für Eure Hilfe.

Btw: Das verwendete Betriebssystem ist Linux, Windows ist aber auch verfügbar.
 
Zuletzt bearbeitet:
Probier mal HxD, ist zwar ein Hex-Editor, aber rechts hat man auch die entsprechenden Ascii-Zeichen und man kann auch nach normalem Ascii-Text (also das, was auch der Windows-Editor "notepad.exe" anzeigt). Mit solch großen Dateien hat HxD keine Probleme.

Aber Treffer zählen usw. kann es nicht, sondern nur reines Suchen (und Ersetzen). Wäre also noch manuelle Arbeit notwendig und es gibt keine Formatierung des Textes (logisch), die Zeilenlänge ist (standardmäßig, kann man z.B. auf 32 ändern) 16 Zeichen bzw. Bytes.

Für Dein Vorhaben gibt es natürlich bessere Programme, wenn sich keine Alternative findet, probiers halt mit HxD. Vorteil ist halt, dass die Datei nicht erst komplett in den RAM geladen werden muss, sondern HxD liest direkt die anzuzeigenden Speicheradressen, Dateien mit mehr als 4 GB können ebenfalls gelesen werden.
 
Zuletzt bearbeitet:
Danke, Vindoriel, für Deine Antwort.

Das Öffnen der Textdatei unter Linux mit gedit o.ä. ist ohne Probleme möglich. Es geht vor allem um das automatische Suchen und Ausgeben des Titels.
 
Schaue dir mal UltraEdit an.

Du solltest aber dir Gedanken darüber machen, was du langfristig mit den Daten machen willst. Wenn du Google bemühst, gibt es diverse Editoren oder Im- und Exporttools mit denen du diese Daten wieder in eine Datenbankform bringen könntest.

Darüber hinaus gibt es natürlich auch noch hunderte diverse XML Editoren, mit denen du auf die Daten zugreifen könntest.
http://www.easy-xml-editor.de/editor.htm
http://www.upcast.de/products/downcast/
https://www.altova.com/de/xmlspy.html
 
Zuletzt bearbeitet:
Könnte mit XSL (https://de.wikipedia.org/wiki/Extensible_Stylesheet_Language) klappen. Hab grad aus Neugier folgendes Stylesheet erstellt. Dazu muss der Dump aber ein gültiges XML sein (war dein Beispiel nicht; z.B. fehlt das root Element, bei dem ich jetzt einfach mal angenommen hab dass es "foo" heißt)

HTML:
<xsl:stylesheet version="1.0" xmlns:xsl="http://www.w3.org/1999/XSL/Transform">
	<xsl:param name="searchString" select="'Max'"/>
	<xsl:output encoding="UTF-8" />
	<xsl:template match="/foo">
	    <xsl:for-each select="page/text">
			 <xsl:if test="contains(text(), $searchString)">
			 	Title: <xsl:value-of select="../title/text()"/>			 	
			 </xsl:if>
	    </xsl:for-each>
	</xsl:template>
</xsl:stylesheet>

Obigen code in eine Datei (z.B. search.xsl) abspeichern und dann durch einen XSLT Prozessor (z.B. MSXSL) durchlaufen lassen:
Code:
msxsl.exe dump.xml search.xsl searchString="Max Mustermann"

dump.xml:
HTML:
<foo>
<page>
<title>Hinweise zur Bedienung der Maschine in Raum B2.08</title>
<text>Bei der Maschine in Raum B2.08 handelt es sich um eine '''[Modellname und Modellnummer]'''.
 
== Inbetriebnahme ==
Bei der Inbetriebnahme ist auf [...] zu achten.
 
== Beim Arbeiten zu beachten ==
[...]
 
== Ausschalten ==
[...]
 
== Ansprechpartner ==
Für die Maschine zuständig ist Max Mustermann.
 
=== Ansprechpartner 2 ===
Falls Max Mustermann nicht erreichbar oder verfügbar ist, bitte Melanie Mustermann fragen.
</text>
</page>
<page>
<title>Hinweise zur Bedienung der Maschine in Raum B2.09</title>
<text>Bei der Maschine in Raum B2.09 handelt es sich um eine '''[Modellname und Modellnummer]'''.
 
== Inbetriebnahme ==
Bei der Inbetriebnahme ist auf [...] zu achten.
 
== X0D5 Beim Arbeiten zu beachten ==
[...]
 
== Ausschalten ==
[...]
 
== Ansprechpartner ==
Für die Maschine zuständig ist Max Mustermann.
 
=== Ansprechpartner 2 ===
Falls Max Mustermann nicht erreichbar oder verfügbar ist, bitte Melanie Mustermann fragen.
</text>
</page>
</foo>

Ist sicher noch nicht perfekt, aber vielleicht reicht's schon. Weiß jedoch nicht ob der MSXSL für die große Datei schnell genug ist... Für Linux gibt's xsltproc oder für Windows alternativ das schon genannte Altova XMLSpy.
 
Zuletzt bearbeitet:
Vielen Dank, werde ich ausprobieren!

Aktuell versuche ich unter Linux in der Konsole mit folgendem Befehl zu arbeiten:

Code:
grep -B 100 -ne "= X0D5" [Dateiname] | grep -e "<title>"

Ist zwar nicht perfekt, funktioniert allerdings so halbwegs. Manche meiner Kollegen haben ihre Beiträge im Wiki mit bestimmten Kürzeln versehen (wie oben "X0D5") um sie bei einer Suche besser wiederzufinden.
 
shortrange schrieb:
Kurz zur Vorgeschichte: Auf der Arbeit hatten wir ein firmeninternes MediaWiki im Intranet. In diesem Wiki wurden Anleitungen, Tipps und Dokumentationen zu firmeninternen Dingen gesammelt, aber auch Diskussionen geführt, Benutzerseiten erstellt, etc. Dieses Wiki war sehr unübersichtlich und chaotisch. Vor knapp zwei Wochen war das Wiki nicht mehr erreichbar und kurz darauf erhielten wir die Meldung, dass der Server durch einen Hardwaredefekt irreparabel beschädigt worden ist und somit auch sämtliche Daten im Wiki vorloren sind. Nun zur guten Nachricht: Ein Kollege hat einen recht aktuellen "Dump" des Wikis auftreiben können.
Wenns nur darum geht, dass Wiki wiederherzustellen, warum spielt ihr dann nicht den Dump in eine neue Installation zurück?

shortrange schrieb:
Jetzt möchte ich beispielsweise alle Artikel nach dem Begriff "Max Mustermann" durchsuchen und die Suchausgabe soll mir den Title (=Inhalt der title-Tags) ausgeben. Wie kann ich das machen?
Sag doch mal, was das Ziel ist. Je nachdem, kann man den Prozess vielleicht ziemlich weit automatisieren.

Bei 1,6GB will man sicher nicht allzuviel händisch machen müssen.
 
andy_m4 schrieb:
Wenns nur darum geht, dass Wiki wiederherzustellen, warum spielt ihr dann nicht den Dump in eine neue Installation zurück?
Weil es einfacher ist, den Quelltext in der Dump-Datei zu bereinigen als im Wikiformat mit "Quelltext bearbeiten" und jeden Artikel einzeln.


andy_m4 schrieb:
Sag doch mal, was das Ziel ist. Je nachdem, kann man den Prozess vielleicht ziemlich weit automatisieren.

Bei 1,6GB will man sicher nicht allzuviel händisch machen müssen.
Es geht darum, die Artikel von bestimmten Inhalten zu bereinigen. Im OP steht zum Beispiel im Code ein "X0D5". Manche Kollegen haben bestimmte Abschnitte in ihren Artikel mit solchen Bezeichnungen versehen, um diese über eine Suche schnell wieder zu finden. Auf anderen Einträgen ist etlicher nicht valider HTML- und CSS-Code eingebunden. Das muss alles raus, was natürlich am einfachsten über einen (halb-)automatisierten Prozess machbar ist.
 
shortrange schrieb:
Weil es einfacher ist, den Quelltext in der Dump-Datei zu bereinigen als im Wikiformat mit "Quelltext bearbeiten" und jeden Artikel einzeln.
Ah ok. Das kam nicht so ganz raus.
Das ist natürlich verständlich.



shortrange schrieb:
Es geht darum, die Artikel von bestimmten Inhalten zu bereinigen. Im OP steht zum Beispiel im Code ein "X0D5". Manche Kollegen haben bestimmte Abschnitte in ihren Artikel mit solchen Bezeichnungen versehen, um diese über eine Suche schnell wieder zu finden. Auf anderen Einträgen ist etlicher nicht valider HTML- und CSS-Code eingebunden. Das muss alles raus, was natürlich am einfachsten über einen (halb-)automatisierten Prozess machbar ist.
Ja. Lässt sich schon machen. invalider HTML-Code lässt sich sogar automatisiert geradeziehen, falls er nicht so entstellt ist, dass es sich überhaupt nicht rekonstruieren lässt, was der Autor wollte. Ähnliches gilt für CSS. Alternativ könnte man sogar versuchen das auf Wiki-Syntax zu konvertieren.

Solche Sachen lassen sich recht gut identifizieren. Was nicht geht ist, wenn da inhaltlich was falsch ist. Sozusagen Fake-News-Detection. :-)

Das Wiki wird ja sicherlich in einer Datenbank gespeichert. Was man so ne grobe Vorgehensweise wäre ist, die XML-Datei zu bereinigen, das ganze ins Wiki zurückspielen und den Rest mit einem Datenbankfrontend durchzugucken. Weil man damit dann auch relativ bequem suchen und editieren kann, um die restlichen Aufgaben die nur händisch zu lösen sind, komfortabel anzugehen.
 
andy_m4 schrieb:
Das Wiki wird ja sicherlich in einer Datenbank gespeichert. Was man so ne grobe Vorgehensweise wäre ist, die XML-Datei zu bereinigen, das ganze ins Wiki zurückspielen und den Rest mit einem Datenbankfrontend durchzugucken. Weil man damit dann auch relativ bequem suchen und editieren kann, um die restlichen Aufgaben die nur händisch zu lösen sind, komfortabel anzugehen.
Welches Datenbankfrontend würde sich dafür anbieten?



Ich versuche aktuell mit grep unter Linux zu arbeiten. In der XML-Datei ist es ja so, dass ein Artikel immer mit dem <page>-Tag beginnt. Kann ich grep über irgendeinen Befehl sagen, dass es nicht oberhalb eines bestimmten Begriffes, in diesem Fall "<page>", suchen soll?

Nachtrag:
Hier nochmal anschaulich erklärt. Momentan arbeite ich mit folgendem grep-Befehl:
Code:
grep -B 100 -nE "X0D5" geretteter-wiki-dump.xml  | grep -E "<title>"

Ich suche in der XML-Datei "geretteter-wiki-dump.xml" nach dem Ausdruck "X0D5". Wenn dieser Ausdruck gefunden wird, soll die betreffende Zeile inklusive 100 Zeilen oberhalb davon ausgegeben werden. Das alles wird dann in den nächsten grep-Befehl gepipt, der in dem jeweiligen Suchergebnis nach "<title>" sucht, um mir den Titel des Artikels zu nennen.

Die Probleme dabei:
1. Wenn es sich um kurze Artikel handelt, kann es sein, dass in den 100 Zeilen oberhalb des Treffers zwei title-Tags enthalten sind und ich einen false positive bekomme.
2. Wenn der Artikel sehr lang ist und der jeweilige Ausdruck erst gegen Ende des Artikels auftaucht, kann es sein, dass die 100 Zeilen nicht ausreichen, um zum Anfang des Artikels zu kommen. Somit findet die zweite grep-Suche keinen title-Tag und ich erhalte einen false negative.

Wenn es nun eine Funktion gibt, mit der ich grep anweisen kann, ab dem Auffinden eines weiteren Befehls nichts mehr oberhalb auszugeben (hier: <page> bei der ersten grep-Suche), könnte ich den Parameter "-B" auf einen sehr großen Wert setzen, sodass ich Problem 1 und 2 gelöst hätte.
 
Zuletzt bearbeitet:
Hallo,

ich würde vorschlagen doch den Dump in eine neue Wiki Installation zu speichern und anschließend mit Bots die Massen Löschung zu machen.

Bei der Gelegenheit kann man sich gleich ein ordentliches Ordnungssystem überlegen.

Empfehlen möchte ich euch neben MediaWiki noch die kostenlosen add ons semanticwiki und bluespice zu installieren.

Neben diversen Befehlen bekommt man so auch die Möglichkeit eines Kategorienbaums. Der wird bei der Strukturierung gerade auf der Startseite helfen.

Viel Glück!
 
@MATRIX_Morpheus
Danke für Deinen Vorschlag, ich habe ihn gerade unter Windows mit msxsl.exe ausprobiert. Leider erscheint eine Fehlermeldung, da es sich nicht um ein valides XML-Dokument handelt. Ein Problem ist, dass die <text>-Tags innerhalb der <page></page>-Tags zwar immer aufgemacht werden, jedoch nie geschlossen. msxsl.exe kommt damit wohl nicht klar.

@Wanderer101
Danke für den Vorschlag. Mal schauen, wie das wird.

Hat noch jemand einen Tipp für grep?
 
Moin!

Was auch noch hilft ist das Buch von Seibert zum Thema Wissensmanagement in Unternehmen mit einem Wiki. Dort werden die verschiedenen Fallen beschrieben, die im Alltag auftreten können und wie man sie lösen kann.

Zusätzlich würde ich eine Person suchen, die sich kontinuierlich um das Wiki kümmert. Nur so kann man die Qualität hoch halten.

Der Link zum Buch:
Enterprise Wikis: Die erfolgreiche Einführung und Nutzung von Wikis in Unternehmen https://www.amazon.de/dp/3834928275/ref=cm_sw_r_cp_apa_R9yMybD4RY6KZ
 
Zuletzt bearbeitet:
shortrange schrieb:
Welches Datenbankfrontend würde sich dafür anbieten?
Spontan fallen mir zwei ein, die auch relativ Endanwendertauglich sind.
Libreoffice Base und Kexi.
Beides dürfte im Repository Deiner Linux-Distribution enthalten sein.
Libreoffice lässt sich natürlich auch unter Windows betreiben.

shortrange schrieb:
Ich versuche aktuell mit grep unter Linux zu arbeiten. In der XML-Datei ist es ja so, dass ein Artikel immer mit dem <page>-Tag beginnt. Kann ich grep über irgendeinen Befehl sagen, dass es nicht oberhalb eines bestimmten Begriffes, in diesem Fall "<page>", suchen soll?
Reguläre Ausdrücke sind beim Parsing von XML eher suboptimal. Ich würde direkt ein XML-Parser darauf ansetzen.


Wenn mir jemand so ein Wikidump (in akzeptabler Größe) zur Verfügung stellt, dann könnte ich mal experimentell schnell was aus dem Boden stampfen.
Darf auch ruhig kaputtes XML sein. So was wie die ersten 1000 Zeilen des Dumps oder Ähnliches.
 
andy_m4 schrieb:
Reguläre Ausdrücke sind beim Parsing von XML eher suboptimal. Ich würde direkt ein XML-Parser darauf ansetzen.
Aus welchem Grund sind reguläre Ausdrücke beim Parsing von XML eher suboptimal?

andy_m4 schrieb:
Wenn mir jemand so ein Wikidump (in akzeptabler Größe) zur Verfügung stellt, dann könnte ich mal experimentell schnell was aus dem Boden stampfen.
Darf auch ruhig kaputtes XML sein. So was wie die ersten 1000 Zeilen des Dumps oder Ähnliches.
Du kannst mit dem Dump von Wikipedia arbeiten: https://dumps.wikimedia.org/dewiki/

Zum Beispiel unter https://dumps.wikimedia.org/dewiki/20170201/ diesen hier: "dewiki-20170201-pages-articles1.xml-p000000001p000425449.bz2 529.4 MB".

Unser Dump ist nach demselben Muster aufgebaut.

Hier die oberen 475 Zeilen aus "dewiki-20170201-pages-articles-multistream.xml.bz2 4.3 GB":
HTML:
<mediawiki xmlns="http://www.mediawiki.org/xml/export-0.10/" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation="http://www.mediawiki.org/xml/export-0.10/ http://www.mediawiki.org/xml/export-0.10.xsd" version="0.10" xml:lang="de">
  <siteinfo>
    <sitename>Wikipedia</sitename>
    <dbname>dewiki</dbname>
    <base>https://de.wikipedia.org/wiki/Wikipedia:Hauptseite</base>
    <generator>MediaWiki 1.29.0-wmf.9</generator>
    <case>first-letter</case>
    <namespaces>
      <namespace key="-2" case="first-letter">Medium</namespace>
      <namespace key="-1" case="first-letter">Spezial</namespace>
      <namespace key="0" case="first-letter" />
      <namespace key="1" case="first-letter">Diskussion</namespace>
      <namespace key="2" case="first-letter">Benutzer</namespace>
      <namespace key="3" case="first-letter">Benutzer Diskussion</namespace>
      <namespace key="4" case="first-letter">Wikipedia</namespace>
      <namespace key="5" case="first-letter">Wikipedia Diskussion</namespace>
      <namespace key="6" case="first-letter">Datei</namespace>
      <namespace key="7" case="first-letter">Datei Diskussion</namespace>
      <namespace key="8" case="first-letter">MediaWiki</namespace>
      <namespace key="9" case="first-letter">MediaWiki Diskussion</namespace>
      <namespace key="10" case="first-letter">Vorlage</namespace>
      <namespace key="11" case="first-letter">Vorlage Diskussion</namespace>
      <namespace key="12" case="first-letter">Hilfe</namespace>
      <namespace key="13" case="first-letter">Hilfe Diskussion</namespace>
      <namespace key="14" case="first-letter">Kategorie</namespace>
      <namespace key="15" case="first-letter">Kategorie Diskussion</namespace>
      <namespace key="100" case="first-letter">Portal</namespace>
      <namespace key="101" case="first-letter">Portal Diskussion</namespace>
      <namespace key="828" case="first-letter">Modul</namespace>
      <namespace key="829" case="first-letter">Modul Diskussion</namespace>
      <namespace key="2300" case="first-letter">Gadget</namespace>
      <namespace key="2301" case="first-letter">Gadget Diskussion</namespace>
      <namespace key="2302" case="case-sensitive">Gadget-Definition</namespace>
      <namespace key="2303" case="case-sensitive">Gadget-Definition Diskussion</namespace>
      <namespace key="2600" case="first-letter">Thema</namespace>
    </namespaces>
  </siteinfo>
  <page>
    <title>Alan Smithee</title>
    <ns>0</ns>
    <id>1</id>
    <revision>
      <id>157406713</id>
      <parentid>153344835</parentid>
      <timestamp>2016-08-26T17:01:12Z</timestamp>
      <contributor>
        <username>Invisigoth67</username>
        <id>178175</id>
      </contributor>
      <comment>/* Referenzen */ Abschnittsnamen korrigiert</comment>
      <model>wikitext</model>
      <format>text/x-wiki</format>
      <text xml:space="preserve">'''Alan Smithee''' steht als [[Pseudonym]] für einen fiktiven Regisseur, der Filme verantwortet, bei denen der eigentliche [[Regisseur]] seinen Namen nicht mit dem Werk in Verbindung gebracht haben möchte. Von 1968 bis 2000 wurde es von der [[Directors Guild of America]] (DGA) für solche Situationen empfohlen, seither ist es '''Thomas Lee'''.&lt;ref&gt;[[Los Angeles Times|latimes]].com: [http://articles.latimes.com/2000/jan/15/entertainment/ca-54271 ''Name of Director Smithee Isn't What It Used to Be''], zuletzt geprüft am 2. April 2011&lt;/ref&gt; ''Alan Smithee'' ist jedoch weiterhin in Gebrauch.

Alternative Schreibweisen sind unter anderem die Ursprungsvariante ''Al&lt;u&gt;len&lt;/u&gt; Smithee'' sowie ''Alan Sm&lt;u&gt;y&lt;/u&gt;thee'' und ''A&lt;u&gt;dam&lt;/u&gt; Smithee''. Auch zwei teilweise asiatisch anmutende Schreibweisen ''Alan Smi Thee'' und ''Sumishii Aran'' gehören – so die [[Internet Movie Database]] – dazu.&lt;ref name=&quot;IMDb&quot;&gt;[http://www.imdb.com/name/nm0000647/ Eigener Eintrag für ''Alan Smithee'' in der IMDb]&lt;/ref&gt;

== Geschichte ==
=== Entstehung ===
Das Pseudonym entstand 1968 infolge der Arbeiten am Western-Film ''Death of a Gunfighter'' (deutscher Titel ''[[Frank Patch – Deine Stunden sind gezählt]]''). Regisseur [[Robert Totten]] und Hauptdarsteller [[Richard Widmark]] gerieten in einen Streit, woraufhin [[Don Siegel]] als neuer Regisseur eingesetzt wurde.

Der Film trug nach Abschluss der Arbeiten noch deutlich Tottens [[Manier (Stil)|Handschrift]], der auch mehr Drehtage als Siegel daran gearbeitet hatte, weshalb dieser die Nennung seines Namens als Regisseur ablehnte. Totten selbst lehnte aber ebenfalls ab. Als Lösung wurde  ''Allen Smithee'' als ein möglichst einzigartiger Name gewählt (bei der späteren Variante ''Alan Smithee'' war das [[Anagramm]] ''The Alias Men'' vermutlich kein Entstehungsgrund).&lt;ref&gt;[http://www.imdb.com/name/nm0000647/bio ''Biography for Alan Smithee''] in der Internet Movie Database&lt;/ref&gt;

In den zeitgenössischen Kritiken wurde der Regisseur u.&amp;nbsp;a. von [[Roger Ebert]] mit den Worten gelobt: {{Zitat-en|Director Allen Smithee, a name I’m not familiar with, allows his story to unfold naturally. He never preaches, and he never lingers on the obvious. His characters do what they have to do.&lt;ref&gt;rogerebert.[[Chicago Sun-Times|suntimes]].com: [http://rogerebert.suntimes.com/apps/pbcs.dll/article?AID=/19690512/REVIEWS/905120301/1023 ''Death of a Gunfighter''], zuletzt geprüft am 2. April 2011&lt;/ref&gt;|Übersetzung=Regisseur Alan Smithee, ein Name, der mir nicht vertraut ist, erlaubt es seiner Handlung, sich natürlich zu entfalten. Er predigt niemals, und er verweilt nie beim Offensichtlichen. Seine Charaktere tun, was sie tun müssen.}}

=== Aufdeckung und Abkehr ===
1997 kam die Parodie ''An Alan Smithee Film: Burn Hollywood Burn'' (deutscher Titel ''[[Fahr zur Hölle Hollywood]]'') in die Kinos, was das Pseudonym einem größeren Publikum bekannt machte, nicht zuletzt weil [[Arthur Hiller (Regisseur)|Arthur Hiller]], der eigentliche Regisseur des Films, selbst seinen Namen zurückzog und analog zum Filmtitel das Pseudonym ''Alan Smithee'' benutzte. Der Film gilt als einer der schlechtesten Filme der 1990er Jahre und gewann fünf [[Goldene Himbeere]]n.

Der Film ''[[Supernova (2000)|Supernova]]'' ist der erste Post-Smithee-Film, dort führte ein gewisser ''Thomas Lee'' alias [[Walter Hill]] die Regie.
&lt;!-- fand nur einen für den von 1990, siehe ''[[Das Kindermädchen]]'':
„Smithee wurde allerdings auch nach ''Supernova'' gesichtet, in einem Film namens ''The Guardian''.“
--&gt;

== Verwendung ==
Die Verwendung dieses oder eines anderen Pseudonyms ist für Mitglieder der DGA streng reglementiert. Ein Regisseur, der für einen von ihm gedrehten Film seinen Namen nicht hergeben möchte, hat nach Sichtung des fertigen Films drei Tage Zeit, anzuzeigen, dass er ein Pseudonym verwenden möchte. Der Rat der DGA entscheidet binnen zwei Tagen über das Anliegen. Erhebt die Produktionsfirma Einspruch, entscheidet ein Komitee aus Mitgliedern der DGA und der Vereinigung der Film- und Fernsehproduzenten, ob der Regisseur ein Pseudonym angeben darf. Über die Beantragung muss der Regisseur Stillschweigen halten, ebenso darf er den fertigen Film nicht öffentlich kritisieren, wenn die DGA ihm die Verwendung eines Pseudonyms zugesteht.&lt;ref&gt;Siehe zu diesen Regelungen [http://www.dga.org/~/media/Files/Contracts/Agreements/2008%20BA/008ba2008article8.pdf Artikel 8, Abschnitt 8-211 des ''Basic Agreement''] (PDF; 125&amp;nbsp;kB) der DGA von 2008, abgerufen am 25. April 2012&lt;/ref&gt; Ein Antrag des Regisseurs auf Pseudonymisierung kann abgelehnt werden, so durfte [[Tony Kaye (Regisseur)|Tony Kaye]] den Namen Smithee bei dem Film ''[[American History X]]'' nicht einsetzen, obwohl er den Antrag stellte.

Auch bei nicht-US-amerikanischen Produktionen wird der Name verwendet, wie etwa beim [[Pilotfilm]] der Fernsehserie ''[[Schulmädchen (Fernsehserie)|Schulmädchen]]''. 2007 sendete die ARD am 8. und 9. August den zweiteiligen TV-Film ''Paparazzo''. Auch in diesem Werk erscheint anstatt des eigentlichen Regisseurs [[Stephan Wagner (Regisseur)|Stephan Wagner]] Alan Smithee im Abspann.

Zu den Regisseuren, die das Pseudonym benutzt haben, gehören:
* [[Don Siegel]] und [[Robert Totten]] (für ''[[Frank Patch – Deine Stunden sind gezählt]]''),
* [[David Lynch]] (für die dreistündige Fernsehfassung von ''[[Der Wüstenplanet (Film)|Der Wüstenplanet]]''),
* [[Chris Christensen]] (''The Omega Imperative''),
* [[Stuart Rosenberg]] (für ''Let’s Get Harry''),
* [[Richard C. Sarafian]] (für ''[[Starfire]]''),
* [[Dennis Hopper]] (für ''[[Catchfire]]''),
* [[Arthur Hiller (Regisseur)|Arthur Hiller]] (für ''[[An Alan Smithee Film: Burn Hollywood Burn]]''),
* [[Rick Rosenthal]] (''Birds II'') und
* [[Kevin Yagher]] (''[[Hellraiser IV – Bloodline]]'').

Der Pilotfilm der Serie ''[[MacGyver]]'' und die fünfte Folge der ersten Staffel führen einen Alan Smithee als Regisseur. Auf der TV-Serien-Seite TV Rage wird Jerrold Freedman als Regisseur des Pilotfilms angegeben. Der Regisseur der fünften Folge ist unbekannt.

Zu den Drehbuchautoren, die das Pseudonym benutzt haben, gehören:
* [[Sam Raimi]] und [[Ivan Raimi]] (die das Drehbuch zu ''Die total beknackte Nuß'' als „Alan Smithee, Jr.“ und „Alan Smithee, Sr.“ schrieben)

Auch in Computerspielen wird dieses Pseudonym angegeben:
* Im Abspann des Ego-Shooters ''Marine Sharpshooter IV'' aus dem Jahr 2008 wird als Art Director des Spiels „Alan Smithee“ genannt.&lt;ref&gt;http://einestages.spiegel.de/external/ShowTopicAlbumBackground/a13641/l26/l0/F.html#featuredEntry&lt;/ref&gt;

2014 produzierte die [[New York City|New Yorker]] Performance-Kompanie [[Big Dance Theater]] ''Alan Smithee Directed this Play'', das im August des Jahres auch in Berlin bei [[Tanz im August]] aufgeführt wurde. &lt;ref&gt;''Alan Smithee ist schuld!'' in [[Frankfurter Allgemeine Sonntagszeitung]] vom 17. August 2014, Seite 36&lt;/ref&gt;

== Literatur ==
* Jeremy Braddock, Stephen Hock (Hrsg.): ''Directed by Allen Smithee.'' Foreword by Andrew Sarris. University of Minnesota Press, Minneapolis, London 2001, ISBN 0-8166-3534-X.

== Weblinks ==
* {{IMDb|nm0000647}}
* [http://www.abc.net.au/rn/arts/atoday/stories/s353584.htm Artikel über Smithee von ABC Online (englisch)]
* [http://einestages.spiegel.de/static/topicalbumbackground/13641/der_mann_der_niemals_lebte.html Der Mann, der niemals lebte, Spiegel Online einestages]
* [http://dradiowissen.de/beitrag/alan-smithee-die-film-legende-lebt Alan Smithee lebt!, DRadio Wissen]

== Einzelnachweise ==
&lt;references /&gt;

{{Normdaten|TYP=p|GND=123396956}}

[[Kategorie:Fiktive Person|Smithee, Alan]]
[[Kategorie:Pseudonym]]
[[Kategorie:Sammelpseudonym|Smithee, Alan]]
[[Kategorie:Werk von Alan Smithee]]</text>
      <sha1>9i928nk20i9bbmd6ktangrkxcfho0tf</sha1>
    </revision>
  </page>
  <page>
    <title>Actinium</title>
    <ns>0</ns>
    <id>3</id>
    <revision>
      <id>161589440</id>
      <parentid>161582822</parentid>
      <timestamp>2017-01-13T09:47:12Z</timestamp>
      <contributor>
        <username>JWBE</username>
        <id>364070</id>
      </contributor>
      <comment>Formalia</comment>
      <model>wikitext</model>
      <format>text/x-wiki</format>
      <text xml:space="preserve">{{Infobox Chemisches Element
&lt;!--- Periodensystem ---&gt;
| Name         = Actinium
| Symbol       = Ac
| Ordnungszahl = 89
| Serie        = Üm
| Gruppe       = 3
| Periode      = 7
| Block        = d
&lt;!--- Allgemein ---&gt;
| Aussehen=silbrig
| CAS          = 7440-34-8
| Massenanteil = 6 · 10&lt;sup&gt;−14&lt;/sup&gt;&amp;nbsp;ppm&lt;ref name=&quot;Harry H. Binder&quot;&gt;Harry H. Binder: ''Lexikon der chemischen Elemente'', S. Hirzel Verlag, Stuttgart 1999, ISBN 3-7776-0736-3.&lt;/ref&gt;
&lt;!--- Atomar ---&gt;
| Hauptquelle  = &lt;ref&gt;Die Werte für die Eigenschaften (Infobox) sind, wenn nicht anders angegeben, aus [http://www.webelements.com/actinium/ www.webelements.com (Actinium)] entnommen.&lt;/ref&gt;
| Atommasse = 227,0278
| Atomradius = 195
| AtomradiusBerechnet = 
| KovalenterRadius = 215
| VanDerWaalsRadius = 
| Elektronenkonfiguration = &amp;#91;[[Radon|Rn]]&amp;#93; 6[[D-Orbital|d]]&lt;sup&gt;1&lt;/sup&gt; 7[[S-Orbital|s]]&lt;sup&gt;2&lt;/sup&gt;
| Austrittsarbeit = 
| Ionisierungsenergie_1 = 499
| Ionisierungsenergie_2 = 1170
| Ionisierungsenergie_3 =
| Ionisierungsenergie_4 =
&lt;!--- Physikalisch ---&gt;
| Aggregatzustand = fest
| Modifikationen = 
| Kristallstruktur = [[Kubisches Kristallsystem|kubisch flächenzentriert]]
| Dichte = 10,07 g/cm&lt;sup&gt;3&lt;/sup&gt;
| RefTempDichte_K = 
| Mohshärte = 
| Magnetismus = 
| Schmelzpunkt_K = 1323
| Schmelzpunkt_C = 1050
| Siedepunkt_K = 3573
| Siedepunkt_C = 3300
| MolaresVolumen = 22,55 · 10&lt;sup&gt;−6&lt;/sup&gt;
| Verdampfungswärme = 400 kJ/mol
| Schmelzwärme = 14
| Dampfdruck =
| RefTempDampfdruck_K =
| Schallgeschwindigkeit = 
| RefTempSchallgeschwindigkeit_K =
| SpezifischeWärmekapazität = &lt;!--27,2--&gt;
| ElektrischeLeitfähigkeit = 
| Wärmeleitfähigkeit = 12
&lt;!--- Chemisch ---&gt;
| Oxidationszustände= 3
| Oxide= 
| Basizität= mäßig basisch
| Normalpotential=  −2,13 [[Volt|V]]&lt;br /&gt;(Ac&lt;sup&gt;3+&lt;/sup&gt; + 3&amp;nbsp;e&lt;sup&gt;−&lt;/sup&gt; → Ac)
| Elektronegativität= 1,1
| Quelle GHS-Kz   = NV
| GHS-Piktogramme = {{GHS-Piktogramme|/}}
| GHS-Signalwort  = 
| H               = {{H-Sätze|/}}
| EUH             = {{EUH-Sätze|/}}
| P               = {{P-Sätze|/}}
| Quelle P        = 
| Quelle GefStKz  = NV
| Gefahrensymbole = {{Gefahrensymbole|/}}
| R               = {{R-Sätze|/}}
| S               = {{S-Sätze|/}}
| Radioaktiv = Ja
&lt;!--- Isotope ---&gt;
| Isotope=
{{Infobox Chemisches Element/Isotop
| Massenzahl= 224
| Symbol= Ac
| NH= 0
| Halbwertszeit= 2,9 [[Stunde|h]]
| AnzahlZerfallstypen= 3
| Zerfallstyp1ZM= [[Elektronen-Einfang|ε]]
| Zerfallstyp1ZE= 1,403
| Zerfallstyp1ZP= [[Radium|&lt;sup&gt;224&lt;/sup&gt;Ra]]
| Zerfallstyp2ZM= [[Alphastrahlung|α]]
| Zerfallstyp2ZE= 9,100
| Zerfallstyp2ZP= [[Francium|&lt;sup&gt;220&lt;/sup&gt;Fr]]
| Zerfallstyp3ZM= [[Betastrahlung|β&lt;sup&gt;−&lt;/sup&gt;]]
| Zerfallstyp3ZE= 0,232
| Zerfallstyp3ZP= [[Thorium|&lt;sup&gt;224&lt;/sup&gt;Th]]
}}
{{Infobox Chemisches Element/Isotop
| Massenzahl= 225
| Symbol= Ac
| NH= 0
| Halbwertszeit= 10 [[Tag|d]]
| AnzahlZerfallstypen= 1
| Zerfallstyp1ZM= [[Alphastrahlung|α]]
| Zerfallstyp1ZE= 5,935
| Zerfallstyp1ZP= [[Francium|&lt;sup&gt;221&lt;/sup&gt;Fr]]
}}
{{Infobox Chemisches Element/Isotop
| Massenzahl= 226
| Symbol= Ac
| NH= 0
| Halbwertszeit= 29,4 [[Stunde|h]]
| AnzahlZerfallstypen= 3
| Zerfallstyp1ZM= [[Betastrahlung|β&lt;sup&gt;−&lt;/sup&gt;]]
| Zerfallstyp1ZE= 0,640
| Zerfallstyp1ZP= [[Thorium|&lt;sup&gt;226&lt;/sup&gt;Th]]
| Zerfallstyp2ZM= [[Elektronen-Einfang|ε]]
| Zerfallstyp2ZE= 1,116
| Zerfallstyp2ZP= [[Radium|&lt;sup&gt;226&lt;/sup&gt;Ra]]
| Zerfallstyp3ZM= [[Alphastrahlung|α]]
| Zerfallstyp3ZE= 5,536
| Zerfallstyp3ZP= [[Francium|&lt;sup&gt;222&lt;/sup&gt;Fr]]
}}
{{Infobox Chemisches Element/Isotop
| Massenzahl= 227
| Symbol= Ac
| NH= 100
| Halbwertszeit= 21,773 [[Jahr|a]]
| AnzahlZerfallstypen= 2
| Zerfallstyp1ZM= [[Betastrahlung|β&lt;sup&gt;−&lt;/sup&gt;]]
| Zerfallstyp1ZE= 0,045
| Zerfallstyp1ZP= [[Thorium|&lt;sup&gt;227&lt;/sup&gt;Th]]
| Zerfallstyp2ZM= [[Alphastrahlung|α]]
| Zerfallstyp2ZE= 5,536
| Zerfallstyp2ZP= [[Francium|&lt;sup&gt;223&lt;/sup&gt;Fr]]
}}
{{Infobox Chemisches Element/Isotop
| Massenzahl= 228
| Symbol= Ac
| NH= -1
| Halbwertszeit= 6,15 h
| AnzahlZerfallstypen= 1
| Zerfallstyp1ZM= [[Betastrahlung|β&lt;sup&gt;−&lt;/sup&gt;]]
| Zerfallstyp1ZE= 2,127
| Zerfallstyp1ZP= [[Thorium|&lt;sup&gt;228&lt;/sup&gt;Th]]
}}
| NMREigenschaften=
}}

'''Actinium''' ist ein [[Radioaktivität|radioaktives]] [[chemisches Element]] mit dem [[Elementsymbol]] '''Ac''' und der [[Ordnungszahl]] 89. Im [[Periodensystem der Elemente]] steht es in der 3.&amp;nbsp;[[Gruppe des Periodensystems|IUPAC-Gruppe]], der [[Scandiumgruppe]]. Das Element ist ein [[Metalle|Metall]] und gehört zur [[Periode-7-Element|7.&amp;nbsp;Periode]], [[Block des Periodensystems|d-Block]]. Es ist der Namensgeber der Gruppe der [[Actinoide]], der ihm folgenden 14 Elemente.

== Geschichte ==
:[[Datei:Periodensystem Mendelejews.jpg|mini|ohne|Mendelejews Periodensystem von 1871 mit einer Lücke für Actinium am unteren Rand, vor Thorium (''Th&amp;nbsp;=&amp;nbsp;231'')]]

Das Actinium wurde im Jahr 1899 von dem französischen Chemiker [[André-Louis Debierne]] entdeckt, der es aus [[Pechblende]] isolierte und ihm zunächst Ähnlichkeiten mit dem [[Titan (Element)|Titan]]&lt;ref&gt;André-Louis Debierne: „Sur une nouvelle matière radio-active“, in: ''[[Comptes rendus]]'', '''1899''', ''129'', S.&amp;nbsp;593–595 ([http://gallica.bnf.fr/ark:/12148/bpt6k3085b/f593.table Gallica]).&lt;/ref&gt; oder dem [[Thorium]]&lt;ref&gt;André-Louis Debierne: „Sur un nouvel élément radio-actif&amp;nbsp;: l’actinium“, in: ''[[Comptes rendus]]'', '''1900''', ''130'', S.&amp;nbsp;906–908 ([http://gallica.bnf.fr/ark:/12148/bpt6k3086n/f906.table Gallica]).&lt;/ref&gt; zuschrieb; seine Bezeichnung leitete er wegen der [[Radioaktivität]] von [[Griechische Sprache|griechisch]] ἀκτίς ''aktís'' ‚Strahl‘ ab.&lt;ref name=&quot;fg&quot;&gt;N. A. Figurowski, ''Die Entdeckung der chemischen Elemente und der Ursprung ihrer Namen'', in deutscher Übersetzung von Leo Korniljew/Ernst Lemke, Moskau 1981, ISBN 3-7614-0561-8, S.&amp;nbsp;64.&lt;/ref&gt; [[Friedrich Giesel]] entdeckte das Element unabhängig davon im Jahr 1902&lt;ref&gt;Friedrich Oskar Giesel: „Ueber Radium und radioactive Stoffe“, in: ''[[Berichte der Deutschen Chemischen Gesellschaft]]'', '''1902''', ''35''&amp;nbsp;(3), S.&amp;nbsp;3608–3611, [[doi:10.1002/cber.190203503187]].&lt;/ref&gt; und beschrieb eine Ähnlichkeit zum [[Lanthan]]; er gab ihm den Namen '''Emanium''',&lt;ref&gt;Friedrich Oskar Giesel: „Ueber den Emanationskörper (Emanium)“, in: ''[[Berichte der Deutschen Chemischen Gesellschaft]]'', '''1904''', ''37''&amp;nbsp;(2), S.&amp;nbsp;1696–1699, [[doi:10.1002/cber.19040370280]].&lt;/ref&gt; eine Bildung zu [[lateinisch]] ''emano'' ‚ausfließen‘, ebenfalls mit Bezug zur abgegebenen Strahlung.&lt;ref name=&quot;fg&quot;/&gt; Nachdem Actinium und Emanium im Jahre 1904 als identisch erkannt worden waren, wurde Debiernes Namensgebung der Vorzug gegeben, da er es zuerst entdeckt hatte.&lt;ref&gt;Friedrich Oskar Giesel: „Ueber Emanium“, in: ''[[Berichte der Deutschen Chemischen Gesellschaft]]'', '''1905''', ''38''&amp;nbsp;(1), S.&amp;nbsp;775–778, [[doi:10.1002/cber.190503801130]].&lt;/ref&gt;

Die Geschichte der Entdeckung wurde in Publikationen von 1971&lt;ref&gt;H. W. Kirby: „The Discovery of Actinium“, in: ''[[Isis (Zeitschrift, 1912)|Isis]]'', '''1971''', ''62''&amp;nbsp;(3), S.&amp;nbsp;290–308 ([http://www.jstor.org/stable/view/229943?seq=1 jstor]).&lt;/ref&gt; und später im Jahr 2000&lt;ref&gt;J. P. Adloff: „The centenary of a controversial discovery: actinium“, in:'' [[Radiochimica Acta|Radiochim. Acta]]'', '''2000''', ''88'', S.&amp;nbsp;123, [[doi:10.1524/ract.2000.88.3-4.123]].&lt;/ref&gt; immer noch als fraglich beschrieben. Sie zeigen, dass die Publikationen von 1904 einerseits und die von 1899 und 1900 andererseits Widersprüche aufweisen.

== Gewinnung und Darstellung ==
Da in [[Uran]]erzen nur wenig Actinium vorhanden ist, spielt diese Quelle keine Rolle für die Gewinnung. Technisch wird das Isotop &lt;sup&gt;227&lt;/sup&gt;Ac durch Bestrahlung von &lt;sup&gt;226&lt;/sup&gt;Ra mit [[Neutron]]en in [[Kernreaktor]]en hergestellt.

:&lt;math&gt;\mathrm{^{226}_{\ 88}Ra\ +\ ^{1}_{0}n\ \longrightarrow \ ^{227}_{\ 88}Ra\ \xrightarrow[42,2 \ min]{\beta^-} \ ^{227}_{\ 89}Ac}&lt;/math&gt;

:&lt;small&gt;Die Zeitangaben sind [[Halbwertszeit]]en.&lt;/small&gt;

Durch den schnellen Zerfall des Actiniums waren stets nur geringe Mengen verfügbar. Die erste künstliche Herstellung von Actinium wurde im [[Argonne National Laboratory]] in [[Chicago]] durchgeführt.

== Eigenschaften ==
=== Physikalische Eigenschaften ===
Das Metall ist silberweiß glänzend&lt;ref name=&quot;blueglow&quot; /&gt; und relativ weich.&lt;ref&gt;Frederick Seitz, David Turnbull: ''Solid state physics: advances in research and applications'', Academic Press, 1964, ISBN 0-12-607716-9, S.&amp;nbsp;289–291 ({{Google Buch|BuchID=F9V3a-0V3r8C|Seite=289}}).&lt;/ref&gt; Aufgrund seiner starken Radioaktivität leuchtet Actinium im Dunkeln in einem hellblauen Licht.&lt;ref name=&quot;blueglow&quot; /&gt;

Actinium ist das namensgebende Element der [[Actinoide]]n, ähnlich wie [[Lanthan]] für die [[Lanthanoide]]n. Die Gruppe der Elemente zeigt deutlichere Unterschiede als die Lanthanoide; daher dauerte es bis 1945, bis [[Glenn T. Seaborg]] die wichtigsten Änderungen zum Periodensystem von Mendelejew vorschlagen konnte: die Einführung der Actinoide.&lt;ref&gt;Glenn T. Seaborg: „The Transuranium Elements“, in: ''[[Science]]'', '''1946''', ''104'', Nr.&amp;nbsp;2704, S.&amp;nbsp;379–386; [[doi:10.1126/science.104.2704.379]]; PMID 17842184.&lt;/ref&gt;

=== Chemische Eigenschaften ===
Es ist sehr reaktionsfähig und wird von Luft und Wasser angegriffen, überzieht sich aber mit einer Schicht von Actiniumoxid, wodurch es vor weiterer Oxidation geschützt ist.&lt;ref name=&quot;blueglow&quot;&gt;Joseph G. Stites, Murrell L. Salutsky, Bob D. Stone: „Preparation of Actinium Metal“, in: ''[[J. Am. Chem. Soc.]]'', '''1955''', ''77''&amp;nbsp;(1), S.&amp;nbsp;237–240; [[doi:10.1021/ja01606a085]]&lt;/ref&gt; Das Ac&lt;sup&gt;3+&lt;/sup&gt;-Ion ist farblos. Das chemische Verhalten von Actinium ähnelt sehr dem [[Lanthan]]. Actinium ist in allen zehn bekannten Verbindungen dreiwertig.&lt;ref&gt;J. J. Katz, W. M. Manning: „Chemistry of the Actinide Elements“, in: ''[[Annual Review of Nuclear Science]]'', '''1952''', ''1'', S.&amp;nbsp;245–262; [[doi:10.1146/annurev.ns.01.120152.001333]].&lt;/ref&gt;

== Isotope ==
Bekannt sind 26 [[Isotop]]e, wovon nur zwei natürlich vorkommen. Das langlebigste Isotop &lt;sup&gt;227&lt;/sup&gt;Ac ([[Halbwertszeit]] 21,8&amp;nbsp;Jahre) hat zwei [[Zerfallskanal|Zerfallskanäle]]: es ist ein [[Alpha-Strahlung|Alpha]]- und [[Beta-Strahlung|Beta]]-Strahler. &lt;sup&gt;227&lt;/sup&gt;Ac ist ein Zerfallsprodukt des Uranisotops &lt;sup&gt;235&lt;/sup&gt;U und kommt zu einem kleinen Teil in Uranerzen vor. Daraus lassen sich wägbare Mengen &lt;sup&gt;227&lt;/sup&gt;Ac gewinnen, die somit ein verhältnismäßig einfaches Studium dieses Elementes ermöglichen. Da sich unter den radioaktiven Zerfallsprodukten einige [[Gammastrahlung|Gammastrahler]] befinden, sind aber aufwändige Strahlenschutzvorkehrungen nötig.

== Verwendung ==
Actinium wird zur Erzeugung von Neutronen eingesetzt, die bei [[Neutronenaktivierungsanalyse|Aktivierungsanalysen]] eine Rolle spielen. Außerdem wird es für die [[Radionuklidbatterie#Wandler|thermoionische Energieumwandlung]] genutzt.

Beim dualen Zerfall des &lt;sup&gt;227&lt;/sup&gt;Ac geht der größte Teil unter Emission von Beta-Teilchen in das [[Thorium]]&lt;nowiki /&gt;isotop &lt;sup&gt;227&lt;/sup&gt;Th, aber ca. 1 % zerfällt durch Alpha-Emission zu [[Francium]] &lt;sup&gt;223&lt;/sup&gt;Fr. Eine Lösung von &lt;sup&gt;227&lt;/sup&gt;Ac ist daher als Quelle für das kurzlebige &lt;sup&gt;223&lt;/sup&gt;Fr verwendbar. Letzteres kann dann regelmäßig abgetrennt und untersucht werden.

== Sicherheitshinweise ==
Einstufungen nach der [[Verordnung (EG) Nr. 1272/2008 (CLP)|CLP-Verordnung]] liegen nicht vor, weil diese nur die chemische Gefährlichkeit umfassen und eine völlig untergeordnete Rolle gegenüber den auf der [[Radioaktivität]] beruhenden Gefahren spielen. Auch Letzteres gilt nur, wenn es sich um eine dafür relevante Stoffmenge handelt.

== Verbindungen ==
Nur eine geringe Anzahl von Actiniumverbindungen ist bekannt. Mit Ausnahme von AcPO&lt;sub&gt;4&lt;/sub&gt; sind sie alle den entsprechenden Lanthanverbindungen ähnlich und enthalten Actinium in der Oxidationsstufe +3.&lt;ref name=&quot;j2&quot;&gt;Sherman Fried, French Hagemann, W. H. Zachariasen: „The Preparation and Identification of Some Pure Actinium Compounds“, in: ''[[J. Am. Chem. Soc.]]'', '''1950''', ''72'', S.&amp;nbsp;771–775 ([[doi:10.1021/ja01158a034]]).&lt;/ref&gt; Insbesondere unterscheiden sich die Gitterkonstanten der jeweiligen Lanthan- und Actinium-Verbindungen nur in wenigen Prozent.&lt;ref name=&quot;j2&quot; /&gt;

:{| class=&quot;wikitable&quot; style=&quot;text-align:center&quot;
! Formel
! Farbe
! Symmetrie
! [[Raumgruppe]]
! [[Pearson-Symbol]]
! ''a'' (pm)
! ''b'' (pm)
! ''c'' (pm)
! ''Z''
! Dichte,&lt;br /&gt;g/cm&lt;sup&gt;3&lt;/sup&gt;
|-
| Ac
| silber
| ''fcc''&lt;ref name=&quot;ach&quot;&gt;J. D. Farr, A. L. Giorgi, M. G. Bowman, R. K. Money: „The crystal structure of actinium metal and actinium hydride“, in: ''[[Journal of Inorganic and Nuclear Chemistry]]'', '''1961''', ''18'', S.&amp;nbsp;42–47 ([[doi:10.1016/0022-1902(61)80369-2]]).&lt;/ref&gt;
| {{Raumgruppe|Fm-3m|kurz}}
| cF4
| 531,1
| 531,1
| 531,1
| 4
| 10,07
|-
| AcH&lt;sub&gt;2&lt;/sub&gt;
|
| kubisch&lt;ref name=&quot;ach&quot; /&gt;
| {{Raumgruppe|Fm-3m|kurz}}
| cF12
| 567
| 567
| 567
| 4
| 8,35
|-
| Ac&lt;sub&gt;2&lt;/sub&gt;O&lt;sub&gt;3&lt;/sub&gt;
| weiß&lt;ref name=&quot;blueglow&quot; /&gt;
| trigonal&lt;ref name=&quot;aco&quot;&gt;W. H. Zachariasen: „Crystal Chemical Studies of the 5''f''-Series of Elements. XII. New Compounds Representing known Structure Types“, in: ''[[Acta Crystallographica]]'', '''1949''', ''2'', S.&amp;nbsp;388–390 ([[doi:10.1107/S0365110X49001016]]).&lt;/ref&gt;
| {{Raumgruppe|P-3m1|kurz}}
| hP5
| 408
| 408
| 630
| 1
| 9,18
|-
| Ac&lt;sub&gt;2&lt;/sub&gt;S&lt;sub&gt;3&lt;/sub&gt;
|
| kubisch&lt;ref name=&quot;acs&quot;&gt;W. H. Zachariasen: „Crystal Chemical Studies of the 5''f''-Series of Elements. VI. The Ce&lt;sub&gt;2&lt;/sub&gt;S&lt;sub&gt;3&lt;/sub&gt;–Ce&lt;sub&gt;3&lt;/sub&gt;S&lt;sub&gt;4&lt;/sub&gt; Type of Structure“, in: ''[[Acta Crystallographica]]'', '''1949''', ''2'', S.&amp;nbsp;57–60 ([[doi:10.1107/S0365110X49000126]]).&lt;/ref&gt;
| {{Raumgruppe|I-43d|kurz}}
| cI28
| 778,56
| 778,56
| 778,56
| 4
| 6,71
|-
| AcF&lt;sub&gt;3&lt;/sub&gt;
| weiß&lt;ref name=&quot;m71&quot;&gt;Gerd Meyer, Lester R. Morss: ''Synthesis of lanthanide and actinide compounds'', Springer, 1991, ISBN 0-7923-1018-7, S.&amp;nbsp;71 ({{Google Buch|BuchID=bnS5elHL2w8C|Seite=71}}).&lt;/ref&gt;
| hexagonal&lt;ref name=&quot;aco&quot; /&gt;&lt;ref name=&quot;j2&quot; /&gt;
| {{Raumgruppe|P-3c1|kurz}}
| hP24
| 741
| 741
| 755
| 6
| 7,88
|-
| AcCl&lt;sub&gt;3&lt;/sub&gt;
|
| hexagonal&lt;ref name=&quot;accl&quot;&gt;W. H. Zachariasen: „Crystal Chemical Studies of the 5''f''-Series of Elements. I. New Structure Types“, in: ''[[Acta Crystallographica]]'', '''1948''', ''1'', S.&amp;nbsp;265–268 ([[doi:10.1107/S0365110X48000703]]).&lt;/ref&gt;&lt;ref name=&quot;j2&quot; /&gt;
| {{Raumgruppe|P63/m|kurz}}
| hP8
| 764
| 764
| 456
| 2
| 4,8
|-
| AcBr&lt;sub&gt;3&lt;/sub&gt;
| weiß&lt;ref name=&quot;j2&quot; /&gt;
| hexagonal&lt;ref name=&quot;accl&quot; /&gt;
| {{Raumgruppe|P63/m|kurz}}
| hP8
| 764
| 764
| 456
| 2
| 5,85
|-
| AcOF
| weiß&lt;ref name=&quot;m87&quot;&gt;Gerd Meyer, Lester R. Morss: ''Synthesis of lanthanide and actinide compounds'', Springer, 1991, ISBN 0-7923-1018-7, S.&amp;nbsp;87–88 ({{Google Buch|BuchID=bnS5elHL2w8C|Seite=87}}).&lt;/ref&gt;
| kubisch&lt;ref name=&quot;j2&quot; /&gt;
| {{Raumgruppe|Fm-3m|kurz}}
|
| 593,1
|
|
|
| 8,28
|-
| AcOCl
|
| tetragonal&lt;ref name=&quot;j2&quot; /&gt;
|
|
| 424
| 424
| 707
|
| 7,23
|-
| AcOBr
|
| tetragonal&lt;ref name=&quot;j2&quot; /&gt;
|
|
| 427
| 427
| 740
|
| 7,89
|-
| AcPO&lt;sub&gt;4&lt;/sub&gt; · 0,5 H&lt;sub&gt;2&lt;/sub&gt;O
|
| hexagonal&lt;ref name=&quot;j2&quot; /&gt;
|
|
| 721
| 721
| 664
|
| 5,48
|}

=== Oxide ===
[[Actinium(III)-oxid]]&amp;nbsp;(Ac&lt;sub&gt;2&lt;/sub&gt;O&lt;sub&gt;3&lt;/sub&gt;) kann durch Erhitzen des [[Actinium(III)-hydroxid|Hydroxids]] bei 500&amp;nbsp;°C oder des [[Actinium(III)-oxalat|Oxalats]] bei 1100&amp;nbsp;°C im Vakuum erhalten werden. Das Kristallgitter ist isotyp mit den Oxiden der meisten dreiwertigen [[Seltenerdmetalle]].&lt;ref name=&quot;j2&quot; /&gt;

=== Halogenide ===
[[Actinium(III)-fluorid]]&amp;nbsp;(AcF&lt;sub&gt;3&lt;/sub&gt;) kann entweder in Lösung oder durch Feststoffreaktion dargestellt werden. Im ersten Fall gibt man bei Raumtemperatur [[Flusssäure]] zu einer Ac&lt;sup&gt;3+&lt;/sup&gt;-Lösung und fällt das Produkt aus. im anderen Fall wird Actinium-Metall mit Fluorwasserstoff bei 700&amp;nbsp;°C in einer Platinapparatur behandelt.

[[Actinium(III)-chlorid]]&amp;nbsp;(AcCl&lt;sub&gt;3&lt;/sub&gt;) wird durch Umsetzung von Actiniumhydroxid oder -oxalat mit [[Tetrachlormethan]] bei Temperaturen oberhalb von 960&amp;nbsp;°C erhalten.&lt;ref name=&quot;j2&quot; /&gt;

Die Reaktion von [[Aluminiumbromid]] und Actinium(III)-oxid führt zum [[Actinium(III)-bromid]]&amp;nbsp;(AcBr&lt;sub&gt;3&lt;/sub&gt;) und Behandlung mit feuchtem Ammoniak bei 500&amp;nbsp;°C führt zum Oxibromid AcOBr.&lt;ref name=&quot;j2&quot; /&gt;

=== Weitere Verbindungen ===
Gibt man [[Natriumdihydrogenphosphat]]&amp;nbsp;(NaH&lt;sub&gt;2&lt;/sub&gt;PO&lt;sub&gt;4&lt;/sub&gt;) zu einer Lösung von Actinium in Salzsäure, erhält man weiß gefärbtes [[Actiniumphosphat]]&amp;nbsp;(AcPO&lt;sub&gt;4&lt;/sub&gt;&amp;nbsp;·&amp;nbsp;0,5&amp;nbsp;H&lt;sub&gt;2&lt;/sub&gt;O); ein Erhitzen von [[Actinium(III)-oxalat]] mit [[Schwefelwasserstoff]] bei 1400&amp;nbsp;°C für ein paar Minuten führt zu schwarzem [[Actinium(III)-sulfid]]&amp;nbsp;(Ac&lt;sub&gt;2&lt;/sub&gt;S&lt;sub&gt;3&lt;/sub&gt;).&lt;ref name=&quot;j2&quot; /&gt;

== Literatur ==
* Harold W. Kirby, Lester R. Morss: [http://radchem.nevada.edu/classes/rdch710/files/Actinium.pdf Actinium], in: Lester R. Morss, Norman M. Edelstein, Jean Fuger (Hrsg.): ''The Chemistry of the Actinide and Transactinide Elements'', Springer, Dordrecht 2006; ISBN 1-4020-3555-1, S.&amp;nbsp;18–51; {{DOI|10.1007/1-4020-3598-5_2}}.

== Weblinks ==
{{Wiktionary}}
{{Commonscat}}
* {{RömppOnline |Name=Actinium |Datum=3. Januar 2015 |ID=RD-01-00659 }}

== Einzelnachweise ==
&lt;references /&gt;

{{Navigationsleiste Periodensystem}}

{{Normdaten|TYP=s|GND=4523163-1|LCCN=sh/85/000706}}</text>
      <sha1>guan5cety9q6gguvumwdcxsdhxumfgd</sha1>
    </revision>
  </page>
 
shortrange schrieb:
Aus welchem Grund sind reguläre Ausdrücke beim Parsing von XML eher suboptimal?
Unteranderem, weil Du Verschachtelungen hast und Du denen nur rekusriv wirklich beikommst. Und das ist mit nem regulären Ausdruck nicht machbar.


shortrange schrieb:
Du kannst mit dem Dump von Wikipedia arbeiten: https://dumps.wikimedia.org/dewiki/
...
Sieht nach brauchbaren Ausgangsmaterial aus.
Wünsch' mir Glück. :-)
 
Zum Glück ist das DUMP-Format ganz gut dokumentiert.
https://www.mediawiki.org/wiki/Help:Export

Es gibt sogar eine DTD dazu:
Code:
<!ELEMENT mediawiki (siteinfo,page*)>
<!-- version contains the version number of the format (currently 0.3) -->
<!ATTLIST mediawiki
  version  CDATA  #REQUIRED 
  xmlns CDATA #FIXED "http://www.mediawiki.org/xml/export-0.3/"
  xmlns:xsi CDATA #FIXED "http://www.w3.org/2001/XMLSchema-instance"
  xsi:schemaLocation CDATA #FIXED
    "http://www.mediawiki.org/xml/export-0.3/ http://www.mediawiki.org/xml/export-0.3.xsd"
  xml:lang  CDATA #IMPLIED
>
<!ELEMENT siteinfo (sitename,base,generator,case,namespaces)>
<!ELEMENT sitename (#PCDATA)>      <!-- name of the wiki -->
<!ELEMENT base (#PCDATA)>          <!-- url of the main page -->
<!ELEMENT generator (#PCDATA)>     <!-- MediaWiki version string -->
<!ELEMENT case (#PCDATA)>          <!-- how cases in page names are handled -->
   <!-- possible values: 'first-letter' | 'case-sensitive'
                         'case-insensitive' option is reserved for future -->
<!ELEMENT namespaces (namespace+)> <!-- list of namespaces and prefixes -->
  <!ELEMENT namespace (#PCDATA)>     <!-- contains namespace prefix -->
  <!ATTLIST namespace key CDATA #REQUIRED> <!-- internal namespace number -->
<!ELEMENT page (title,id?,restrictions?,(revision|upload)*)>
  <!ELEMENT title (#PCDATA)>         <!-- Title with namespace prefix -->
  <!ELEMENT id (#PCDATA)> 
  <!ELEMENT restrictions (#PCDATA)>  <!-- optional page restrictions -->
<!ELEMENT revision (id?,timestamp,contributor,minor?,comment?,text)>
  <!ELEMENT timestamp (#PCDATA)>     <!-- according to ISO8601 -->
  <!ELEMENT minor EMPTY>             <!-- minor flag -->
  <!ELEMENT comment (#PCDATA)> 
  <!ELEMENT text (#PCDATA)>          <!-- Wikisyntax -->
  <!ATTLIST text xml:space CDATA  #FIXED "preserve">
<!ELEMENT contributor ((username,id) | ip)>
  <!ELEMENT username (#PCDATA)>
  <!ELEMENT ip (#PCDATA)>
<!ELEMENT upload (timestamp,contributor,comment?,filename,src,size)>
  <!ELEMENT filename (#PCDATA)>
  <!ELEMENT src (#PCDATA)>
  <!ELEMENT size (#PCDATA)>

Das hilft ggf. auch beim validieren.

Trotzdem ist es wegen der Dateigröße etwas tricky, da man nicht einfach intern einen XML-Baum aufbauen kann.
Deshalb werde ich Event-basiertes parsing a-la SAX und XML-Baum kombinieren. Nur alles was innerhalb von <page> steht wird damit via XML-Bäumen erfasst. Die außerhalb liegenden Tags SAX-ähnlich.

Von der Geschwindigkeit her scheint es auch gut auszuschauen. Nach ersten Tests hab ich ne 1GB XML-Datei in weniger als einer Minute verarbeitet und eingelesen.

Mehr folgt hier in Kürze. Muss immer gucken, dass ich Lücken in der knappen Zeit gut ausnutze. :-)
Zum Wochenende hin sollte sich das Zeitproblem aber hoffentlich entspannen.
 
So. Ich hab jetzt mal was gebastelt.
Ist jetzt natürlich nicht bis ins Ende ausgereift, sondern hat eher den Status eines Prototypen und sicher hier und da noch einige kleine Fehler, scheint aber grundsätzlich zu funktionieren.

-> http://xserv.bplaced.net/ewd/
 
Zurück
Oben