Merge ohne eindeutige Schlüsselvariable
Verfasst: Di 19. Nov 2013, 13:00
Hallo,
ich möchte zwei Datensätze verschmelzen, habe allerdings das Problem, dass ich keine eindeutige Schlüsselvariable habe.
Beispiel: Patente aus Technologieklassen
Datei 1: 'Patent_id';'Technologiefeld';'Weitere Variablen1,2,3'
Datei 2: 'Patent_id';'Technologiefeld';'Unterkategorie'
Da Patente in mehreren Technologieklassen gleichzeitig angemeldet werden können, gibt es teilweise mehrmals die gleiche Patent_id in Datei 1. Genauso in Datei 2, nur hier ist zusätzlich die Information aus 'Unterkategorie' enthalten. Diese Information will ich in Datei 1 integrieren.
In dieser ist aber teilweise nur ein Fall enthalten, da ja die weitere Aufsplittung hier fehlt. Wie kann ich also über 'Patent_id' und 'Technologiefeld' die Einträge abgleichen und die zugehörigen Unterkategorien ergänzen? Zusätzlich müssten die Einträge dann jeweils entsprechend in Datei 1 dupliziert werden, wenn der sonst identische Eintrag mehrere Unterkategorien aus Datei 2 bekommt.
Jegliche Versuche das mit merge zu lösen, sind leider gescheitert. Ich hoffe meine Erklärung ist verständlich, sonst gerne nachfragen. Bereits im Voraus ein rießges Dankeschön!
Viele Grüße
Kugell
ich möchte zwei Datensätze verschmelzen, habe allerdings das Problem, dass ich keine eindeutige Schlüsselvariable habe.
Beispiel: Patente aus Technologieklassen
Datei 1: 'Patent_id';'Technologiefeld';'Weitere Variablen1,2,3'
Datei 2: 'Patent_id';'Technologiefeld';'Unterkategorie'
Da Patente in mehreren Technologieklassen gleichzeitig angemeldet werden können, gibt es teilweise mehrmals die gleiche Patent_id in Datei 1. Genauso in Datei 2, nur hier ist zusätzlich die Information aus 'Unterkategorie' enthalten. Diese Information will ich in Datei 1 integrieren.
In dieser ist aber teilweise nur ein Fall enthalten, da ja die weitere Aufsplittung hier fehlt. Wie kann ich also über 'Patent_id' und 'Technologiefeld' die Einträge abgleichen und die zugehörigen Unterkategorien ergänzen? Zusätzlich müssten die Einträge dann jeweils entsprechend in Datei 1 dupliziert werden, wenn der sonst identische Eintrag mehrere Unterkategorien aus Datei 2 bekommt.
Jegliche Versuche das mit merge zu lösen, sind leider gescheitert. Ich hoffe meine Erklärung ist verständlich, sonst gerne nachfragen. Bereits im Voraus ein rießges Dankeschön!
Viele Grüße
Kugell