Erläuterung zum Bearbeitungssystem BearbEZB3.htm
Die gesamte Datenbank der EZB umfasst ca. 40000 Titel. Diese ist in der Datei ezbgesamtliste2.txt enthalten und bildet die Grundlage der Suchsysteme ASEZA und ASLA, deren Datenbank ca. 30000 Titel umfasst. Die Titel dieser Datenbank sind mit wenigen Daten ausgestattet. Im Prinzip könnte die Datenbank aus den vorliegenden Zeitschriftentiteln der EZB aufgebaut werden. Selbst die ISSN ist nicht unbedingt erforderlich, da sie für die wesentliche Verknüpfungen der Suchsysteme mit GoogleScholar und Google nicht verwertbar ist und auch die Verknüpfungen mit der EZB und der ZDB problemlos über die Titel erfolgen könnten. Nur bei Titeln, die allzuviele Treffer liefern, würden Nachteile entstehen. Sonst bietet die ISSN lediglich einen Vorteil für die interne Verwaltung des Titelmaterials, um z.B. doppelte Erfassungen zu vermeiden.
Die von der EZB praktizierte Schreibweise der Titel, so wie auf deren Webseiten angezeigt und so auch in der ezbgesamtliste aufgeführt werden, müssen an die allgemein von Google Scholar erfasste Schreibweise angeglichen werden. Die nicht zum originalen Titel gehörenden zusätzlichen Vermerke (Erscheinungsdaten, Titeländerungen, Verfügbarkeit usw.) müssen in jedem Fall für die reine Titelangabe weggelassen werden. Die Verfügbarkeit kann aber getrennt davon für die zusätzliche Angabe zum Besitzvermerk erfasst werden. Wesentlich ist, dass Google Scholar die Titel der Zeitschriften normalerweise ohne die auf bestimmte Zeichen folgenden ergänzenden Zusätze erfasst und ebenso den hinter der Serienkennung folgenden Zusatz weglässt, die Serienhinweise SERIES, SECTION und PART aber berücksichtigt.
Beispiele für das Weglassen von Zusätzen:
>PALLAS: EINE ZEITSCHRIFT FÜR STAATS- UND KRIEGS-KUNST
=PALLAS
>HUAFEI-GONGYE = J OF THE CHEMICAL FERTILIZER INDUSTRY
=HUAFEI-GONGYE
>HYLE - AN INTERNATIONAL J FOR THE PHILOSOPHY OF CHEMISTRY
=HYLE
>ARCHIVE OF APPLIED MECHANICS / INGENIEUR ARCHIV
=ARCHIVE OF APPLIED MECHANICS
Beispiele für Serien
>ENVIRONMENTAL POLLUTION SERIES A:
ECOLOGICAL AND BIOLOGICAL
=ENVIRONMENTAL POLLUTION SERIES A
>ENVIRONMENTAL POLLUTION SERIES B: CHEMICAL AND PHYSICAL
=ENVIRONMENTAL POLLUTION SERIES B
In diesen Beispielen werden die hinter den Zeichen : , /, -, und
. stehenden Zusätze weggelassen. Es gibt aber Fälle, wo die
hinter diesen Zeichen stehenden Ergänzungen wesentliche, d.h.
unterscheidende Zusätze sind und wo diese daher nicht
weggelassen werden können. Google Scholar übernimmt in diesen
Fällen die Titel ohne diese Zeichen:
>ADVANCES IN HUMAN FACTORS/ERGONOMICS
= ADVANCES IN HUMAN FACTORS ERGONOMICS
>ARCHIVES OF DISEASE IN CHILDHOOD / EDUCATION AND PRACTICE
= ARCHIVES OF DISEASE IN CHILDHOOD EDUCATION AND PRACTICE
>ARCHIVES OF DISEASE IN CHILDHOOD / FETAL AND NEONATAL
= ARCHIVES OF DISEASE IN CHILDHOOD FETAL AND NEONATAL
>JAHRESBERICHT / UMWELTBUNDESAMT
= JAHRESBERICHT UMWELTBUNDESAMT
>CLINICAL MEDICINE: ARTHRITIS AND MUSCULOSKELETAL DISORDERS
>CLINICAL MEDICINE: BLOOD DISORDERS
>CLINICAL MEDICINE: CASE REPORTS
>CLINICAL MEDICINE: GASTROENTEROLOGY
>CLINICAL MEDICINE: PEDIATRICS
>CURRENT MEDICINAL CHEMISTRY. ANTI-CANCER AGENTS
= CURRENT MEDICINAL CHEMISTRY ANTI-CANCER AGENTS
>CURRENT MEDICINAL CHEMISTRY. ANTI-INFECTIVE AGENTS
= CURRENT MEDICINAL CHEMISTRY ANTI-INFECTIVE AGENTS
· In runden und eckigen Klammern Stehendes wird entfernt:
>ACM TRANSACTIONS ON DATABASE SYSTEMS (ACM TODS)
>J OF SYNCHROTRON RADIATION [SYNCHROTRON RADIATION ONLINE]
· Serienvermerke werden im allgemeinen ohne Zusätze nach den
aufzählenden Zahlen oder Buchstaben (I,II..., A, B C ...)
abgeschlossen, die folgenden Zusätze weggelassen. SERIES,
SECTION, PART wird im allgemeinen beibehalten.
· Übersetzte Titel (z.B. die russischen nach C/C..) werden
entfernt.
· Umlaute, Akzente usw, werden beibehalten, müssen für die
Google Scholar-Verknüpfung allerdings umgewandelt werden, ebenso
die anderen sprachbezogenen Zeichen.
Etwas problematisch sind nur die gleichlautenden Titel, die überwiegend aus einem Titelwort bestehen und die o.g. gleichlautenden Titel mit unterschiedlichen Zusätzen. Mit dem Programm BearbEZB4 können aus der Liste der gefundenen Titel EZBgesamtISSN diese Problemtitel für eine spätere Korrektur der ISSN aussortiert werden.
In diesem Programm fehlt die Erfassung der Zeitbeschränkung von Lizenzen, die im Einarbeitungsprogramm integriert ist, das daher eine etwas komplexere Programmierung erfordert.
Codezeilen mit Erläuterungen
Das Programm enthält dementsprechend im wesentlichen die Codierungen zum Entfernen von Zeichen und von Zusätzen hinter Zeichen. Der massgebliche, gekürzte Titel, wird mit den Titeln der Bestansliste G und der Ergänzungsliste TT verglichen.
Z0=TA[x-1].replace(/\s\(.........+\)|=.+|\s-.+|:\s.+|:.+|\.\s.+|\/\s.+/g,"")+"*";//verkürzter
Titel
Z1=TA[x].replace(/\s\(.........+\)|=.+|\s-.+|:\s.+|:.+|\.\s.+|\/\s.+/g,"")+"*";//verkürzter
Titel
Z2=TA[x+1].replace(/\s\(.......+\)|=.+|\s-.+|:\s.+|:.+|\.\s.+|\/\s.+/g,"")+"*";//verkürzter
Titel
Zunächst werden die beiden verkürzten Titel Z1 und Z2 gebildet
zt2=TA[x].match(/\(.......+\)/g);// in runden Klammern stehendes
(vor allem Zeitbeschränkungen) wird gesucht
zt3=TA[x+1].match(/\(.......+\)/g);// dasselbe für den folgenden
Titel
if(zt2)
zt2a=zt2.join("");// Zusammenfassung der Klammern
if(!zt2)
zt2a="";
Häufig tritt der Fall ein, dass Z1 und Z2 gleich sind. Die zunächst entfernten Zusätze müssen dann wieder eingesetzt werden, weil es sich entweder um serienähnliche Titel handelt oder die nachfolgenden unterschiedlichen Zusätze als identifizierende Teile nicht weggelassen werden können. Ausgenommen davon sind gleichlautende Titel mit unterschiedlicher Zeitbeschränkung in runden Klammern.
if(Z1==Z2||Z1==Z0) // falls Z1 dem nachfolgenden oder
vorangehenden Titel gleich ist
{
Z1b=TA[x].replace(/:|-\s|\/\s/g,""); //
Trennungszeichen aus Original wieder entfernt
Z1bb=Z1b.replace(zt2a,""); // Klammern mit Inhalt
entfernt)
Z1a=Z1bb.replace(/\(|\)/g,""); // restliche Klammern
entfernt // dadurch wird z.B. aus (BBA) BBA
if(zt3) // falls Klammern für Zeitbeschränkung im zweiten Titel
zz="!!"; // das Zeichen !! wird ergänzt
if(!zt3)
zz="!?"; // andernfalls das Zeichen !?
}
if(Z1!=Z2&&Z1!=Z0) // falls Z1 ungleich dem nachfolgenden
oder vorangehenden Titel {
Z1a=Z1.replace(/\s\*|\*|\)|\(/g,""); // werden diese
Zeichen und vor allem die Klammerzeichen entfernt
zz="";
}
z3=Z1a.match(/SERIES\s\w+|PART\s\w+|SECTION\s\w+|\s+[A-H]\s/);//
Serienvermerke mit Folgendem gesucht
z3a=Z1a.match(/SERIES\s\w.+|\bPART\s\w|SECTION\s\w.+|\s+[A-H]\s.+/);
// Serienvermerke gesucht
if(z3&&!z3a) // falls z3 und nicht z3a
Z4=Z1a; // bleibt Z1a bestehen
if(z3&&z3a) // falls z3 und z3a
Z4=Z1a.replace(z3a,z3); // wird z3a durch z3 ersetzt, d.h. die
Zusätze werden entfernt
if(!z3||!z3a) // falls nicht z3 oder nicht z3a
Z4=Z1a; // bleibt Z1a bestehen
Z4a=Z4+"="; // Z4 wird mit = abgeschlossen
Z4b=Z4a.replace(/\s+=/,"="); // Leerstellen vor =
werden entfernt
p1=G.indexOf(">"+Z4b); // Z4b wird in dem gesamten
Inhalt der Bestandsliste G gesucht
if(p1!=-1) // falls gefunden
{
treffer2++;
p1a=G.indexOf(">",p1+1); // das folgende > in G
wird gesucht
Gs=G.substring(p1,p1a); // der Teilstring Gs wird gebildet
iss=Gs.match(/\d\d\d\d\d\d\d\w/g); // die ISSN wird ermittelt
if(iss)
issa=iss.join("=");
if(!iss)
issa=" null"; falls keine ISSN, wird "null"
ergänzt
F.document.write("<br>"+">"+Z4+"="+issa+"
+G"+zz); // Gefundenes wird mit +G ausgeschrieben
}
if(p1==-1||!iss) // falls nicht gefunden oder keine ISSN
ermittelt
{
p2=TT.indexOf(">"+Z4b); // wird der Titel in der
Ergänzungsdatenbank TT gesucht
if(p2!=-1) // falls gefunden, wird wie oben weiter verfahren
{
treffer3++;
p2a=TT.indexOf(">",p2+1);
Ts=TT.substring(p2,p2a);
iss=Ts.match(/\d\d\d\d\d\d\d\w/g);
if(iss)
issa=iss.join("=");
if(!iss)
issa=" null";
F.document.write("<br>"+">"+Z4+"="+issa+"
+T"+zt2a+zz); // Gefundenes wird mit +T ausgeschrieben
}
}
if(p1==-1&&p2==-1)// falls nicht in G und nicht in T
gefunden
F2.document.write("<br>"+">"+Z4+zt2a+zz);
// ausgeschrieben
}
if(Z1==Z2) // falls Z1 gleich dem nachfolgenden Titel
{
if(TA[x+1]!=TA[x]) // falls die Originaltitel ungleich
if(!zt3) // falls keine Zeitbeschränkung
F3.document.write("<b><br>"+">"+TA[x]+"<br>"+">"+TA[x+1]+"</b>");
}
z4=TA[x].match(/SERIES|SECTION|\bPART\s\w|\s[A-H]\s|SER\./); //
Serien werden gesucht
if(z4) // falls ja
F3.document.write("<br>"+">"+TA[x]);
// Serientitel werden ausgeschrieben
}
alert(treffer2);
alert(treffer3);
}
Augeschrieben werden die in der Bestandsliste G und der
Ergänzungsliste TT gefundenen Titel im 1. Fenster, die in beiden
Listen nicht gefundenen Titel im 2. Fenster und die
gleichlautenden und Serientitel im 3. Fenster.