பைத்தானில் டேட்டாஃப்ரேம்களை எவ்வாறு இணைப்பது என்பதை அறிக

பைத்தானில் டேட்டாஃப்ரேம்களை எவ்வாறு இணைப்பது என்பதை அறிக

நீங்கள் பைத்தானைப் பயன்படுத்தினால், எளிமையான பணிகளுக்குக் கூட, அதன் மூன்றாம் தரப்பு நூலகங்களின் முக்கியத்துவத்தை நீங்கள் அறிந்திருக்கலாம். பாண்டாஸ் நூலகம், டேட்டாஃப்ரேம்களுக்கான சிறந்த ஆதரவுடன், அத்தகைய நூலகங்களில் ஒன்றாகும்.





நீங்கள் பைதான் டேட்டாஃப்ரேம்களில் பல வகையான கோப்புகளை இறக்குமதி செய்யலாம் மற்றும் வெவ்வேறு தரவுத் தொகுப்புகளைச் சேமிக்க பல்வேறு பதிப்புகளை உருவாக்கலாம். DataFrames ஐப் பயன்படுத்தி உங்கள் தரவை இறக்குமதி செய்தவுடன், விரிவான பகுப்பாய்வு செய்ய அவற்றை ஒன்றிணைக்கலாம்.





அடிப்படைகளை சமாளித்தல்

நீங்கள் ஒன்றிணைப்பதைத் தொடங்குவதற்கு முன், நீங்கள் ஒன்றிணைக்க DataFrames இருக்க வேண்டும். வளர்ச்சி நோக்கங்களுக்காக, நீங்கள் சோதனை செய்ய சில போலி தரவை உருவாக்கலாம்.





பைத்தானில் டேட்டா ஃப்ரேம்களை உருவாக்கவும்

முதல் படியாக, உங்கள் பைதான் கோப்பில் பாண்டாஸ் லைப்ரரியை இறக்குமதி செய்யவும். Pandas என்பது பைத்தானில் டேட்டாஃப்ரேம்களைக் கையாளும் மூன்றாம் தரப்பு நூலகமாகும். நீங்கள் பயன்படுத்தலாம் இறக்குமதி நூலகத்தைப் பயன்படுத்துவதற்கான அறிக்கை பின்வருமாறு:

import pandas as pd

உங்கள் குறியீட்டு குறிப்புகளைக் குறைக்க நூலகப் பெயருக்கு மாற்றுப்பெயரை நீங்கள் ஒதுக்கலாம்.



நீங்கள் அகராதிகளை உருவாக்க வேண்டும், அதை நீங்கள் DataFrames ஆக மாற்றலாம். சிறந்த முடிவுகளுக்கு, இரண்டு அகராதி மாறிகளை உருவாக்கவும்- கட்டளை1 மற்றும் கட்டளை2- குறிப்பிட்ட தகவல்களைச் சேமிக்க:

dict1 = {"user_id": ["001", "002", "003", "004", "005"], 
"FName": ["John", "Brad", "Ron", "Roald", "Chris"],
"LName": ["Harley", "Cohen", "Dahl", "Harrington", "Kerr-Hislop"]}

dict2 = {"user_id": ["001", "002", "003", "004"], "Age": [15, 28, 34, 24]}

உங்கள் டேட்டாஃப்ரேம்களை பின்னர் இணைப்பதற்கான முதன்மை விசையாகச் செயல்பட, இரண்டு அகராதி மதிப்புகளிலும் பொதுவான உறுப்பு இருக்க வேண்டும் என்பதை நினைவில் கொள்ளவும்.





உங்கள் அகராதிகளை டேட்டாஃப்ரேம்களாக மாற்றவும்

உங்கள் அகராதி மதிப்புகளை DataFrames ஆக மாற்ற, நீங்கள் பின்வரும் முறையைப் பயன்படுத்தலாம்:

df1 = pd.DataFrame(dict1) 
df2 = pd.DataFrame(dict2)

DataFrame செயல்பாட்டைக் குறிப்பிட்டு அழுத்துவதன் மூலம் DataFrame இல் உள்ள மதிப்புகளைச் சரிபார்க்க சில IDEகள் உங்களை அனுமதிக்கின்றன. இயக்கவும் / செயல்படுத்தவும் . பல உள்ளன பைதான்-இணக்கமான IDEகள் , நீங்கள் கற்றுக்கொள்வதற்கு எளிதான ஒன்றைத் தேர்ந்தெடுத்து தேர்வு செய்யலாம்.





அமேசான் ஃபயர் 10 இல் கூகிள் பிளே
  ஜூபிடர் நோட்புக் குறியீடு துணுக்கு

உங்கள் DataFrames இன் உள்ளடக்கத்தில் நீங்கள் திருப்தி அடைந்தவுடன், நீங்கள் ஒன்றிணைக்கும் படிக்குச் செல்லலாம்.

மெர்ஜ் செயல்பாட்டுடன் பிரேம்களை இணைத்தல்

ஒன்றிணைப்பு செயல்பாடு என்பது இரண்டு டேட்டாஃப்ரேம்களை இணைக்க நீங்கள் பயன்படுத்தக்கூடிய முதல் பைதான் செயல்பாடாகும். இந்த செயல்பாடு பின்வரும் இயல்புநிலை வாதங்களை எடுக்கும்:

pd.merge(DataFrame1, DataFrame2, how= type of merge)

எங்கே:

  • pd பாண்டாஸ் நூலகத்தின் மாற்றுப்பெயர்.
  • ஒன்றிணைக்க DataFrames ஐ இணைக்கும் செயல்பாடாகும்.
  • DataFrame1 மற்றும் DataFrame2 இணைக்கப்பட வேண்டிய இரண்டு DataFrames ஆகும்.
  • எப்படி ஒன்றிணைக்கும் வகையை வரையறுக்கிறது.

சில கூடுதல் விருப்ப வாதங்கள் உள்ளன, நீங்கள் சிக்கலான தரவு கட்டமைப்பைக் கொண்டிருக்கும்போது அவற்றைப் பயன்படுத்தலாம்.

ஒன்றிணைக்கும் வகையை எவ்வாறு வரையறுப்பது என்பதற்கு, நீங்கள் வெவ்வேறு மதிப்புகளைப் பயன்படுத்தலாம். இந்த வகையான ஒன்றிணைப்பு உங்களுக்கு நன்கு தெரிந்திருக்கும் தரவுத்தள அட்டவணையில் சேர SQL ஐப் பயன்படுத்தியது .

இடது இணைப்பு

இடது இணைத்தல் வகையானது முதல் DataFrame இன் மதிப்புகளை அப்படியே வைத்திருக்கும் மற்றும் இரண்டாவது DataFrame இலிருந்து பொருந்தும் மதிப்புகளை இழுக்கிறது.

கணினியிலிருந்து Android தொலைபேசியை தொலைவிலிருந்து அணுகுவது எப்படி
  ஜூபிடர் நோட்புக் குறியீடு துணுக்கு

வலது இணைத்தல்

சரியான ஒன்றிணைப்பு வகையானது, இரண்டாவது DataFrame இன் மதிப்புகளை அப்படியே வைத்திருக்கும் மற்றும் முதல் DataFrame இலிருந்து பொருந்தும் மதிப்புகளை இழுக்கும்.

  ஜூபிடர் நோட்புக் குறியீடு துணுக்கு

உள் இணைப்பு

உள் இணைப்பு வகையானது டேட்டாஃப்ரேம்கள் இரண்டிலிருந்தும் பொருந்தக்கூடிய மதிப்புகளைத் தக்கவைத்து, பொருந்தாத மதிப்புகளை நீக்குகிறது.

  ஜூபிடர் நோட்புக் குறியீடு துணுக்கு

வெளிப்புற ஒன்றிணைப்பு

வெளிப்புற ஒன்றிணைப்பு வகை அனைத்து பொருந்தக்கூடிய மற்றும் பொருந்தாத மதிப்புகளைத் தக்கவைத்து, டேட்டாஃப்ரேம்களை ஒன்றாக ஒருங்கிணைக்கிறது.

  ஜூபிடர் நோட்புக் குறியீடு துணுக்கு

Concat செயல்பாட்டை எவ்வாறு பயன்படுத்துவது

தி தொடர்பு பைத்தானின் மற்ற ஒன்றிணைப்பு செயல்பாடுகளுடன் ஒப்பிடும்போது செயல்பாடு ஒரு நெகிழ்வான விருப்பமாகும். கான்காட் செயல்பாட்டின் மூலம், நீங்கள் டேட்டாஃப்ரேம்களை செங்குத்தாகவும் கிடைமட்டமாகவும் இணைக்கலாம்.

இருப்பினும், இந்தச் செயல்பாட்டைப் பயன்படுத்துவதில் உள்ள குறைபாடு என்னவென்றால், அது இயல்பாகவே பொருந்தாத மதிப்புகளை நிராகரிக்கிறது. வேறு சில தொடர்புடைய செயல்பாடுகளைப் போலவே, இந்த செயல்பாடும் சில வாதங்களைக் கொண்டுள்ளது, அவற்றில் சில மட்டுமே வெற்றிகரமான ஒருங்கிணைப்புக்கு அவசியம்.

வார்த்தையில் ஒரு கோடு போடுவது எப்படி
concat(dataframes, axis=0, join='outer'/inner)

எங்கே:

  • தொடர்பு DataFramesஐ இணைக்கும் செயல்பாடு ஆகும்.
  • தரவுச்சட்டங்கள் இணைக்கப்பட வேண்டிய DataFrames வரிசை.
  • அச்சு 0 கிடைமட்டமாகவும், 1 செங்குத்தாகவும் இருக்கும் ஒருங்கிணைப்பின் திசையைக் குறிக்கிறது.
  • சேர ஒரு வெளி அல்லது உள் இணைப்பைக் குறிப்பிடுகிறது.

மேலே உள்ள இரண்டு DataFrames ஐப் பயன்படுத்தி, நீங்கள் concat செயல்பாட்டைப் பின்வருமாறு முயற்சி செய்யலாம்:

# define the dataframes in a list format 
df_merged_concat = pd.concat([df1, df2])

# print the results of the Concat function
print(df_merged_concat)

மேலே உள்ள குறியீட்டில் அச்சு மற்றும் கூட்டு வாதங்கள் இல்லாதது இரண்டு தரவுத்தொகுப்புகளையும் ஒருங்கிணைக்கிறது. இதன் விளைவாக வரும் வெளியீடு போட்டி நிலையைப் பொருட்படுத்தாமல் அனைத்து உள்ளீடுகளையும் கொண்டுள்ளது.

இதேபோல், நீங்கள் concat செயல்பாட்டின் திசை மற்றும் வெளியீட்டைக் கட்டுப்படுத்த கூடுதல் வாதங்களைப் பயன்படுத்தலாம்.

பொருந்தக்கூடிய அனைத்து உள்ளீடுகளுடனும் வெளியீட்டைக் கட்டுப்படுத்த:

# Concatenating all matching values between the two dataframes based on their columns 
df_merged_concat = pd.concat([df1, df2], axis=1, join = 'inner')

print(df_merged_concat)

முடிவு இரண்டு DataFrames க்கு இடையில் மட்டுமே பொருந்தக்கூடிய அனைத்து மதிப்புகளையும் கொண்டுள்ளது.

  ஜூபிடர் நோட்புக் குறியீடு துணுக்கு

பைத்தானுடன் டேட்டாஃப்ரேம்களை இணைத்தல்

டேட்டாஃப்ரேம்கள் பைத்தானின் ஒருங்கிணைந்த பகுதியாகும், அவற்றின் நெகிழ்வுத்தன்மை மற்றும் செயல்பாட்டைக் கருத்தில் கொண்டு. அவற்றின் பன்முகப் பயன்பாடுகளைக் கருத்தில் கொண்டு, பல்வேறு பணிகளை மிக எளிதாகச் செய்ய நீங்கள் அவற்றை விரிவாகப் பயன்படுத்தலாம்.

நீங்கள் இன்னும் Python DataFrames பற்றி கற்றுக் கொண்டிருந்தால், சில Excel கோப்புகளை இறக்குமதி செய்து, பின்னர் அவற்றை வெவ்வேறு அணுகுமுறைகளுடன் இணைக்கவும்.