Uniq உடன் லினக்ஸ் உரை கோப்பில் நகல் தரவை எவ்வாறு கண்டுபிடிப்பது

Uniq உடன் லினக்ஸ் உரை கோப்பில் நகல் தரவை எவ்வாறு கண்டுபிடிப்பது

மீண்டும் மீண்டும் வரிகள் மற்றும் நகல் சொற்களைக் கொண்ட உரை கோப்புகளை நீங்கள் எப்போதாவது பார்த்திருக்கிறீர்களா? ஒருவேளை நீங்கள் வழக்கமாக கட்டளை வெளியீட்டில் வேலை செய்யலாம் மற்றும் தனித்துவமான சரங்களுக்கு வடிகட்ட வேண்டும். லினக்ஸில் உரை கோப்புகள் மற்றும் தேவையற்ற தரவை அகற்றும்போது, ​​யூனிக் கட்டளை உங்கள் சிறந்த பந்தயம்.





இந்த கட்டுரையில், யூனிக் கட்டளையை ஆழமாக விவாதிப்போம், ஒரு உரை கோப்பிலிருந்து நகல் வரிகளை அகற்ற கட்டளையை எவ்வாறு பயன்படுத்துவது என்பது பற்றிய விரிவான வழிகாட்டியுடன்.





யூனிக் கட்டளை என்றால் என்ன?

லினக்ஸில் உள்ள யூனிக் கட்டளை ஒரு உரை கோப்பில் ஒரே மாதிரியான கோடுகளை காட்ட பயன்படுகிறது. நீங்கள் ஒரு உரை கோப்பிலிருந்து நகல் வார்த்தைகள் அல்லது சரங்களை நீக்க விரும்பினால் இந்த கட்டளை உதவியாக இருக்கும். தேவையற்ற நகல்களைக் கண்டுபிடிப்பதற்காக யூனிக் கட்டளை அருகிலுள்ள வரிகளுடன் பொருந்துகிறது என்பதால், இது வரிசைப்படுத்தப்பட்ட உரை கோப்புகளுடன் மட்டுமே வேலை செய்கிறது.





அதிர்ஷ்டவசமாக, நீங்கள் குழாய் செய்யலாம் வகைபடுத்து கட்டளைக்கு இணக்கமான வகையில் உரை கோப்பை ஒழுங்கமைக்க uniq உடன் கட்டளை. மீண்டும் மீண்டும் வரிகளைக் காண்பிப்பதைத் தவிர, யூனிக் கட்டளை ஒரு உரை கோப்பில் நகல் கோடுகள் ஏற்படுவதையும் கணக்கிட முடியும்.

யூனிக் கட்டளையை எவ்வாறு பயன்படுத்துவது

யுனிக் உடன் நீங்கள் பயன்படுத்தக்கூடிய பல்வேறு விருப்பங்கள் மற்றும் கொடிகள் உள்ளன. அவற்றில் சில அடிப்படை மற்றும் மீண்டும் மீண்டும் வரிகளை அச்சிடுதல் போன்ற எளிய செயல்பாடுகளைச் செய்கின்றன, மற்றவை லினக்ஸில் உரை கோப்புகளுடன் அடிக்கடி வேலை செய்யும் மேம்பட்ட பயனர்களுக்கானவை.



அடிப்படை தொடரியல்

யூனிக் கட்டளையின் அடிப்படை தொடரியல்:

uniq option input output

...எங்கே விருப்பம் கட்டளையின் குறிப்பிட்ட முறைகளைத் தூண்டுவதற்குப் பயன்படுத்தப்படும் கொடி, உள்ளீடு செயலாக்கத்திற்கான உரை கோப்பு, மற்றும் வெளியீடு வெளியீட்டை சேமித்து வைக்கும் கோப்பின் பாதை.





தி வெளியீடு வாதம் விருப்பமானது மற்றும் தவிர்க்கலாம். பயனர் உள்ளீட்டு கோப்பை குறிப்பிடவில்லை எனில், யூனிக் நிலையான வெளியீட்டில் இருந்து தரவை உள்ளீடாக எடுத்துக்கொள்கிறது. இது ஒரு பயனரை யூனிக் மூலம் குழாய் செய்ய அனுமதிக்கிறது பிற லினக்ஸ் கட்டளைகள் .

எடுத்துக்காட்டு உரை கோப்பு

நாங்கள் உரை கோப்பைப் பயன்படுத்துவோம் நகல். txt கட்டளைக்கான உள்ளீடாக.





127.0.0.1 TCP
127.0.0.1 UDP
Do catch this
DO CATCH THIS
Don't match this
Don't catch this
This is a text file.
This is a text file.
THIS IS A TEXT FILE.
Unique lines are really rare.

இந்த உரை கோப்பை நாம் ஏற்கனவே பயன்படுத்தி வரிசைப்படுத்தியுள்ளோம் வகைபடுத்து கட்டளை நீங்கள் வேறு சில உரை கோப்புகளுடன் வேலை செய்கிறீர்கள் என்றால், பின்வரும் கட்டளையைப் பயன்படுத்தி அதை வரிசைப்படுத்தலாம்:

sort filename.txt > sorted.txt

நகல் வரிகளை அகற்று

உள்ளீட்டில் இருந்து மீண்டும் மீண்டும் சரங்களை அகற்றி, தனித்துவமான வெளியீட்டை அச்சிடுவதே யூனிக்கின் மிக அடிப்படையான பயன்பாடாகும்.

uniq duplicate.txt

வெளியீடு:

வரியின் இரண்டாவது நிகழ்வை கணினி காட்டாது என்பதை கவனிக்கவும் இது ஒரு உரை கோப்பு . மேலும், மேற்கூறிய கட்டளை கோப்பில் உள்ள தனிப்பட்ட வரிகளை மட்டுமே அச்சிடுகிறது மற்றும் அசல் உரை கோப்பின் உள்ளடக்கத்தை பாதிக்காது.

மீண்டும் மீண்டும் வரிகளை எண்ணுங்கள்

ஒரு உரை கோப்பில் மீண்டும் மீண்டும் வரிகளின் எண்ணிக்கையை வெளியிட, இதைப் பயன்படுத்தவும் -சி இயல்புநிலை கட்டளையுடன் கொடி.

uniq -c duplicate.txt

வெளியீடு:

கணினி உரை கோப்பில் இருக்கும் ஒவ்வொரு வரியின் எண்ணிக்கையையும் காட்டுகிறது. அந்த வரியை நீங்கள் காணலாம் இது ஒரு உரை கோப்பு கோப்பில் இரண்டு முறை நிகழ்கிறது. இயல்பாக, uniq கட்டளை வழக்கு உணர்திறன் கொண்டது.

உரை கோப்பிலிருந்து நகல் வரிகளை மட்டும் அச்சிட, இதைப் பயன்படுத்தவும் -டி கொடி தி -டி குறிக்கிறது நகல் .

uniq -D duplicate.txt

கணினி பின்வருமாறு வெளியீட்டை காண்பிக்கும்.

This is a text file.
This is a text file.

நகல்களைச் சரிபார்க்கும்போது புலங்களைத் தவிர்க்கவும்

சரங்களை பொருத்தும்போது குறிப்பிட்ட எண்ணிக்கையிலான புலங்களை நீங்கள் தவிர்க்க விரும்பினால், நீங்கள் அதைப் பயன்படுத்தலாம் -f கட்டளையுடன் கொடி. தி -f குறிக்கிறது களம் .

பின்வரும் உரை கோப்பைக் கவனியுங்கள் புலங்கள். உரை .

192.168.0.1 TCP
127.0.0.1 TCP
354.231.1.1 TCP
Linux FS
Windows FS
macOS FS

முதல் புலத்தைத் தவிர்க்க:

uniq -f 1 fields.txt

வெளியீடு:

192.168.0.1 TCP
Linux FS

மேற்கூறிய கட்டளை முதல் புலத்தை (ஐபி முகவரிகள் மற்றும் ஓஎஸ் பெயர்கள்) தவிர்த்து, இரண்டாவது வார்த்தையுடன் (டிசிபி மற்றும் எஃப்எஸ்) பொருந்துகிறது. பின்னர், அது ஒவ்வொரு போட்டியின் முதல் நிகழ்வை வெளியீடாகக் காட்டியது.

ஒப்பிடும் போது எழுத்துக்களை புறக்கணிக்கவும்

புலங்களைத் தவிர்ப்பது போல, நீங்கள் எழுத்துக்களையும் தவிர்க்கலாம். தி -s நகல் வரிகளுடன் பொருந்தும்போது தவிர்க்க வேண்டிய எழுத்துக்களின் எண்ணிக்கையைக் குறிப்பிட கொடி உங்களை அனுமதிக்கிறது. நீங்கள் பணிபுரியும் தரவு பின்வருமாறு பட்டியல் வடிவில் இருக்கும்போது இந்த அம்சம் உதவுகிறது:

குரோம் ஏன் ஒரு நினைவகப் பன்றி
1. First
2. Second
3. Second
4. Second
5. Third
6. Third
7. Fourth
8. Fifth

கோப்பில் உள்ள முதல் இரண்டு எழுத்துக்களை (பட்டியல் எண்) புறக்கணிக்க list.txt :

uniq -s 2 list.txt

வெளியீடு:

மேலே உள்ள வெளியீட்டில், முதல் இரண்டு எழுத்துக்கள் புறக்கணிக்கப்பட்டன, மீதமுள்ளவை தனித்துவமான கோடுகளுடன் பொருந்தின.

டூப்ளிகேட்டுகளுக்கான முதல் N எழுத்துக்களின் எண்ணிக்கையை சரிபார்க்கவும்

தி -இன் கொடி நகல்களுக்கு ஒரு குறிப்பிட்ட எண்ணிக்கையிலான எழுத்துக்களை மட்டுமே சரிபார்க்க அனுமதிக்கிறது. உதாரணத்திற்கு:

uniq -w 2 duplicate.txt

மேற்கூறிய கட்டளை முதல் இரண்டு எழுத்துக்களுடன் மட்டுமே பொருந்தும் மற்றும் தனித்துவமான வரிகள் இருந்தால் அச்சிடலாம்.

வெளியீடு:

வழக்கு உணர்திறனை அகற்று

மேலே குறிப்பிட்டுள்ளபடி, ஒரு கோப்பில் வரிகளை பொருத்தும்போது யூனிக் கேஸ்-சென்சிட்டிவ் ஆகும். எழுத்து வழக்கைப் புறக்கணிக்க, பயன்படுத்தவும் -நான் கட்டளையுடன் விருப்பம்.

uniq -i duplicate.txt

பின்வரும் வெளியீட்டை நீங்கள் காண்பீர்கள்.

மேலே உள்ள வெளியீட்டில் அறிவிப்பு, யூனிக் வரிகளைக் காட்டவில்லை இதைப் பிடிக்கவும் மற்றும் இது ஒரு டெக்ஸ்ட் ஃபைல் .

ஒரு கோப்புக்கு வெளியீட்டை அனுப்பவும்

ஒரு கோப்பிற்கு uniq கட்டளையின் வெளியீட்டை அனுப்ப, நீங்கள் பயன்படுத்தலாம் வெளியீடு திசைதிருப்புதல் ( > ) பாத்திரம் பின்வருமாறு:

uniq -i duplicate.txt > otherfile.txt

ஒரு உரை கோப்புக்கு வெளியீட்டை அனுப்பும் போது, ​​கணினி கட்டளையின் வெளியீட்டை காட்டாது. புதிய கோப்பின் உள்ளடக்கத்தை நீங்கள் பயன்படுத்திப் பார்க்கலாம் பூனை கட்டளை

cat otherfile.txt

நீங்கள் வேறு வழிகளைப் பயன்படுத்தலாம் லினக்ஸில் ஒரு கோப்பிற்கு கட்டளை வரி வெளியீட்டை அனுப்பவும் .

யூனிக்குடன் நகல் தரவை பகுப்பாய்வு செய்தல்

பெரும்பாலான நேரங்களில் லினக்ஸ் சேவையகங்களை நிர்வகிக்கும் போது, ​​நீங்கள் முனையத்தில் வேலை செய்வீர்கள் அல்லது உரை கோப்புகளைத் திருத்தலாம். எனவே, ஒரு உரை கோப்பில் உள்ள வரிகளின் தேவையற்ற நகல்களை எவ்வாறு அகற்றுவது என்பதை அறிவது உங்கள் லினக்ஸ் திறமைக்கு ஒரு பெரிய சொத்தாக இருக்கும்.

ஒரு கோப்பில் உரையை எப்படி வடிகட்டி வரிசைப்படுத்துவது என்று தெரியாவிட்டால் உரை கோப்புகளுடன் வேலை செய்வது வெறுப்பாக இருக்கும். உங்கள் வேலையை எளிதாக்க, லினக்ஸில் பல உரை எடிட்டிங் கட்டளைகள் உள்ளன செட் மற்றும் விழி இது உரை கோப்புகள் மற்றும் கட்டளை வரி வெளியீடுகளுடன் திறமையாக வேலை செய்ய உங்களை அனுமதிக்கிறது.

பகிர் பகிர் ட்வீட் மின்னஞ்சல் இந்த 10 செட் உதாரணங்கள் உங்களை லினக்ஸ் பவர் பயனராக மாற்றும்

லினக்ஸ் சக்தி பயனராக ஆக வேண்டுமா? செட் கொண்டு பிடிப்பது உதவியாக இருக்கும். இந்த 10 செட் உதாரணங்களிலிருந்து கற்றுக்கொள்ளுங்கள்.

அடுத்து படிக்கவும்
தொடர்புடைய தலைப்புகள்
  • லினக்ஸ்
  • லினக்ஸ்
எழுத்தாளர் பற்றி தீபேஷ் சர்மா(79 கட்டுரைகள் வெளியிடப்பட்டன)

தீபு MUO வில் லினக்ஸின் இளைய ஆசிரியர் ஆவார். லினக்ஸில் தகவல் வழிகாட்டிகளை எழுதுகிறார், அனைத்து புதியவர்களுக்கும் ஆனந்த அனுபவத்தை வழங்குவதை நோக்கமாகக் கொண்டுள்ளார். திரைப்படங்களைப் பற்றி உறுதியாக தெரியவில்லை, ஆனால் நீங்கள் தொழில்நுட்பத்தைப் பற்றி பேச விரும்பினால், அவர் உங்கள் பையன். அவரது ஓய்வு நேரத்தில், அவர் புத்தகங்களைப் படிப்பது, வெவ்வேறு இசை வகைகளைக் கேட்பது அல்லது அவரது கிட்டார் வாசிப்பதைக் காணலாம்.

தீபேஷ் சர்மாவின் இதரப் படைப்புகள்

எங்கள் செய்திமடலுக்கு குழுசேரவும்

தொழில்நுட்ப குறிப்புகள், மதிப்புரைகள், இலவச மின் புத்தகங்கள் மற்றும் பிரத்யேக ஒப்பந்தங்களுக்கு எங்கள் செய்திமடலில் சேரவும்!

குழுசேர இங்கே சொடுக்கவும்