Replikují výsledky z pd.merge v SQL?

hlasů
0

Hrál jsem si s některými datovými množinami lokálně v Pythonu a nyní se pokouším replikovat stejné výsledky v cloudovém prostředí s SQL.

Mám 3 tabulky, každá s více duplicitními ID. Například tabulka A bude obsahovat ID a, b, c, d, ... , tabulka B bude obsahovat ID a, c, e, a1, a2 ... a tabulka C bude obsahovat ID d, f, a2, b1, b2, ...

V současné době dělám pd.merge pro tabulku A a tabulku B na ID a a tabulka C s výslednou tabulkou od prvního sloučení ID a2 . Při používání pd.merge jsem si všiml, že by to přidalo _x nebo a _y na duplicitní ID (tím myslím na první pd.merge tabulky A a tabulky B, c z tabulky A by se stalo c_x , a c z tabulky B by se stalo c_y atd. pro další duplicitní ID. Totéž by platilo pro jakékoli další duplicitní ID pro jakékoli spojení.

Jak bych mohl tento proces replikovat a obejít problém s duplicitními ID v SQL?

Položena 26/05/2020 v 03:30
zdroj uživatelem
V jiných jazycích...                            


1 odpovědí

hlasů
0

Myslím, že můžete přejmenovat ve spojit zbytek zbývajících sloupců s novými jmény:

SELECT table_A.ID_a, table_A.c_ID as c_ID_from_A, table_B.c_ID as c_ID_from_B
FROM table_A
JOIN table_B ON(table_A.ID_a = table_B.ID_a)

Doufám, že to bude užitečné.

Odpovězeno 10/06/2020 v 15:51
zdroj uživatelem

Cookies help us deliver our services. By using our services, you agree to our use of cookies. Learn more