Erläuterung zum Bearbeitungssystem BearbEZB3.htm

Die gesamte Datenbank der EZB umfasst ca. 40000 Titel. Diese ist in der Datei ezbgesamtliste2.txt enthalten und bildet die Grundlage der Suchsysteme ASEZA und ASLA, deren Datenbank ca. 30000 Titel umfasst. Die Titel dieser Datenbank sind mit wenigen Daten ausgestattet. Im Prinzip könnte die Datenbank aus den vorliegenden Zeitschriftentiteln der EZB aufgebaut werden. Selbst die ISSN ist nicht unbedingt erforderlich, da sie für die wesentliche Verknüpfungen der Suchsysteme mit GoogleScholar und Google nicht verwertbar ist und auch die Verknüpfungen mit der EZB und der ZDB problemlos über die Titel erfolgen könnten. Nur bei Titeln, die allzuviele Treffer liefern, würden Nachteile entstehen. Sonst bietet die ISSN lediglich einen Vorteil für die interne Verwaltung des Titelmaterials, um z.B. doppelte Erfassungen zu vermeiden.

Die von der EZB praktizierte Schreibweise der Titel, so wie auf deren Webseiten angezeigt und so auch in der ezbgesamtliste aufgeführt werden, müssen an die allgemein von Google Scholar erfasste Schreibweise angeglichen werden. Die nicht zum originalen Titel gehörenden zusätzlichen Vermerke (Erscheinungsdaten, Titeländerungen, Verfügbarkeit usw.) müssen in jedem Fall für die reine Titelangabe weggelassen werden. Die Verfügbarkeit kann aber getrennt davon für die zusätzliche Angabe zum Besitzvermerk erfasst werden. Wesentlich ist, dass Google Scholar die Titel der Zeitschriften normalerweise ohne die auf bestimmte Zeichen folgenden ergänzenden Zusätze erfasst und ebenso den hinter der Serienkennung folgenden Zusatz weglässt, die Serienhinweise SERIES, SECTION und PART aber berücksichtigt.

Beispiele für das Weglassen von Zusätzen:
>PALLAS: EINE ZEITSCHRIFT FÜR STAATS- UND KRIEGS-KUNST
=PALLAS
>HUAFEI-GONGYE = J OF THE CHEMICAL FERTILIZER INDUSTRY
=HUAFEI-GONGYE
>HYLE - AN INTERNATIONAL J FOR THE PHILOSOPHY OF CHEMISTRY
=HYLE
>ARCHIVE OF APPLIED MECHANICS / INGENIEUR ARCHIV
=ARCHIVE OF APPLIED MECHANICS

Beispiele für Serien

>ENVIRONMENTAL POLLUTION SERIES A: ECOLOGICAL AND BIOLOGICAL
=ENVIRONMENTAL POLLUTION SERIES A
>ENVIRONMENTAL POLLUTION SERIES B: CHEMICAL AND PHYSICAL
=ENVIRONMENTAL POLLUTION SERIES B


In diesen Beispielen werden die hinter den Zeichen : , /, -, und . stehenden Zusätze weggelassen. Es gibt aber Fälle, wo die hinter diesen Zeichen stehenden Ergänzungen wesentliche, d.h. unterscheidende Zusätze sind und wo diese daher nicht weggelassen werden können. Google Scholar übernimmt in diesen Fällen die Titel ohne diese Zeichen:

>ADVANCES IN HUMAN FACTORS/ERGONOMICS
= ADVANCES IN HUMAN FACTORS ERGONOMICS
>ARCHIVES OF DISEASE IN CHILDHOOD / EDUCATION AND PRACTICE
= ARCHIVES OF DISEASE IN CHILDHOOD EDUCATION AND PRACTICE
>ARCHIVES OF DISEASE IN CHILDHOOD / FETAL AND NEONATAL
= ARCHIVES OF DISEASE IN CHILDHOOD FETAL AND NEONATAL
>JAHRESBERICHT / UMWELTBUNDESAMT
= JAHRESBERICHT UMWELTBUNDESAMT

>CLINICAL MEDICINE: ARTHRITIS AND MUSCULOSKELETAL DISORDERS
>CLINICAL MEDICINE: BLOOD DISORDERS
>CLINICAL MEDICINE: CASE REPORTS
>CLINICAL MEDICINE: GASTROENTEROLOGY
>CLINICAL MEDICINE: PEDIATRICS

>CURRENT MEDICINAL CHEMISTRY. ANTI-CANCER AGENTS
= CURRENT MEDICINAL CHEMISTRY ANTI-CANCER AGENTS
>CURRENT MEDICINAL CHEMISTRY. ANTI-INFECTIVE AGENTS
= CURRENT MEDICINAL CHEMISTRY ANTI-INFECTIVE AGENTS

· In runden und eckigen Klammern Stehendes wird entfernt:
>ACM TRANSACTIONS ON DATABASE SYSTEMS (ACM TODS)
>J OF SYNCHROTRON RADIATION [SYNCHROTRON RADIATION ONLINE]

· Serienvermerke werden im allgemeinen ohne Zusätze nach den aufzählenden Zahlen oder Buchstaben (I,II..., A, B C ...) abgeschlossen, die folgenden Zusätze weggelassen. SERIES, SECTION, PART wird im allgemeinen beibehalten.
· Übersetzte Titel (z.B. die russischen nach C/C..) werden entfernt.
· Umlaute, Akzente usw, werden beibehalten, müssen für die Google Scholar-Verknüpfung allerdings umgewandelt werden, ebenso die anderen sprachbezogenen Zeichen.

Etwas problematisch sind nur die gleichlautenden Titel, die überwiegend aus einem Titelwort bestehen und die o.g. gleichlautenden Titel mit unterschiedlichen Zusätzen. Mit dem Programm BearbEZB4 können aus der Liste der gefundenen Titel EZBgesamtISSN diese Problemtitel für eine spätere Korrektur der ISSN aussortiert werden.

In diesem Programm fehlt die Erfassung der Zeitbeschränkung von Lizenzen, die im Einarbeitungsprogramm integriert ist, das daher eine etwas komplexere Programmierung erfordert.

Codezeilen mit Erläuterungen

Das Programm enthält dementsprechend im wesentlichen die Codierungen zum Entfernen von Zeichen und von Zusätzen hinter Zeichen. Der massgebliche, gekürzte Titel, wird mit den Titeln der Bestansliste G und der Ergänzungsliste TT verglichen.

Z0=TA[x-1].replace(/\s\(.........+\)|=.+|\s-.+|:\s.+|:.+|\.\s.+|\/\s.+/g,"")+"*";//verkürzter Titel
Z1=TA[x].replace(/\s\(.........+\)|=.+|\s-.+|:\s.+|:.+|\.\s.+|\/\s.+/g,"")+"*";//verkürzter Titel
Z2=TA[x+1].replace(/\s\(.......+\)|=.+|\s-.+|:\s.+|:.+|\.\s.+|\/\s.+/g,"")+"*";//verkürzter Titel

Zunächst werden die beiden verkürzten Titel Z1 und Z2 gebildet


zt2=TA[x].match(/\(.......+\)/g);// in runden Klammern stehendes (vor allem Zeitbeschränkungen) wird gesucht
zt3=TA[x+1].match(/\(.......+\)/g);// dasselbe für den folgenden Titel
if(zt2)
zt2a=zt2.join("");// Zusammenfassung der Klammern
if(!zt2)
zt2a="";

Häufig tritt der Fall ein, dass Z1 und Z2 gleich sind. Die zunächst entfernten Zusätze müssen dann wieder eingesetzt werden, weil es sich entweder um serienähnliche Titel handelt oder die nachfolgenden unterschiedlichen Zusätze als identifizierende Teile nicht weggelassen werden können. Ausgenommen davon sind gleichlautende Titel mit unterschiedlicher Zeitbeschränkung in runden Klammern.

if(Z1==Z2||Z1==Z0) // falls Z1 dem nachfolgenden oder vorangehenden Titel gleich ist
{
Z1b=TA[x].replace(/:|-\s|\/\s/g,""); // Trennungszeichen aus Original wieder entfernt
Z1bb=Z1b.replace(zt2a,""); // Klammern mit Inhalt entfernt)
Z1a=Z1bb.replace(/\(|\)/g,""); // restliche Klammern entfernt // dadurch wird z.B. aus (BBA) BBA
if(zt3) // falls Klammern für Zeitbeschränkung im zweiten Titel
zz="!!"; // das Zeichen !! wird ergänzt
if(!zt3)
zz="!?"; // andernfalls das Zeichen !?
}
if(Z1!=Z2&&Z1!=Z0) // falls Z1 ungleich dem nachfolgenden oder vorangehenden Titel {
Z1a=Z1.replace(/\s\*|\*|\)|\(/g,""); // werden diese Zeichen und vor allem die Klammerzeichen entfernt
zz="";
}
z3=Z1a.match(/SERIES\s\w+|PART\s\w+|SECTION\s\w+|\s+[A-H]\s/);// Serienvermerke mit Folgendem gesucht
z3a=Z1a.match(/SERIES\s\w.+|\bPART\s\w|SECTION\s\w.+|\s+[A-H]\s.+/); // Serienvermerke gesucht
if(z3&&!z3a) // falls z3 und nicht z3a
Z4=Z1a; // bleibt Z1a bestehen
if(z3&&z3a) // falls z3 und z3a
Z4=Z1a.replace(z3a,z3); // wird z3a durch z3 ersetzt, d.h. die Zusätze werden entfernt
if(!z3||!z3a) // falls nicht z3 oder nicht z3a
Z4=Z1a; // bleibt Z1a bestehen
Z4a=Z4+"="; // Z4 wird mit = abgeschlossen
Z4b=Z4a.replace(/\s+=/,"="); // Leerstellen vor = werden entfernt
p1=G.indexOf(">"+Z4b); // Z4b wird in dem gesamten Inhalt der Bestandsliste G gesucht
if(p1!=-1) // falls gefunden
{
treffer2++;
p1a=G.indexOf(">",p1+1); // das folgende > in G wird gesucht
Gs=G.substring(p1,p1a); // der Teilstring Gs wird gebildet
iss=Gs.match(/\d\d\d\d\d\d\d\w/g); // die ISSN wird ermittelt
if(iss)
issa=iss.join("=");
if(!iss)
issa=" null"; falls keine ISSN, wird "null" ergänzt
F.document.write("<br>"+">"+Z4+"="+issa+" +G"+zz); // Gefundenes wird mit +G ausgeschrieben
}
if(p1==-1||!iss) // falls nicht gefunden oder keine ISSN ermittelt
{
p2=TT.indexOf(">"+Z4b); // wird der Titel in der Ergänzungsdatenbank TT gesucht
if(p2!=-1) // falls gefunden, wird wie oben weiter verfahren
{
treffer3++;
p2a=TT.indexOf(">",p2+1);
Ts=TT.substring(p2,p2a);
iss=Ts.match(/\d\d\d\d\d\d\d\w/g);
if(iss)
issa=iss.join("=");
if(!iss)
issa=" null";
F.document.write("<br>"+">"+Z4+"="+issa+" +T"+zt2a+zz); // Gefundenes wird mit +T ausgeschrieben
}
}
if(p1==-1&&p2==-1)// falls nicht in G und nicht in T gefunden
F2.document.write("<br>"+">"+Z4+zt2a+zz); // ausgeschrieben
}

if(Z1==Z2) // falls Z1 gleich dem nachfolgenden Titel
{
if(TA[x+1]!=TA[x]) // falls die Originaltitel ungleich
if(!zt3) // falls keine Zeitbeschränkung
F3.document.write("<b><br>"+">"+TA[x]+"<br>"+">"+TA[x+1]+"</b>");
}
z4=TA[x].match(/SERIES|SECTION|\bPART\s\w|\s[A-H]\s|SER\./); // Serien werden gesucht
if(z4) // falls ja
F3.document.write("<br>"+">"+TA[x]); // Serientitel werden ausgeschrieben
}
alert(treffer2);
alert(treffer3);
}


Augeschrieben werden die in der Bestandsliste G und der Ergänzungsliste TT gefundenen Titel im 1. Fenster, die in beiden Listen nicht gefundenen Titel im 2. Fenster und die gleichlautenden und Serientitel im 3. Fenster.