linux command

join

Linux Command – join ใช้ในการเชื่อมข้อมูล 2 file ด้วย field ที่เหมือนกัน

 

คำสั่ง

จากตัวอย่าง file1 และ file2 ต้องทำการจัดเรียงลำดับ field ที่จะเป็น key ในการ join ก่อนทุกครั้ง

$ cat file1
dog,13
ant,10
bat,11
cat,12
boy,14
man,23
rat,21
$ cat file2
rat,small
ant,small
bat,small
cat,small
dog,large
boy,large
man,large

$ cat file1 |sort > file1.sort
$ cat file2 |sort > file2.sort

$ cat file1.sort
ant,10
bat,11
boy,14
cat,12
dog,13
man,23
rat,21
$ cat file2.sort
ant,small
bat,small
boy,large
cat,small
dog,large
man,large
rat,small

 

1. ทำการเชื่อม key ด้วย field 1 จาก file1 และ file2

join -t ‘<delimeter>’ <file1> <file2>

$ join -t ',' file1.sort file2.sort
ant,10,small
bat,11,small
boy,14,large
cat,12,small
dog,13,large
man,23,large

 

2. สามารถระบุ field ที่จะทำเป็น key ในการเชื่อม

ตัวอย่าง file A.txt และ B.txt

$ cat A.txt
John A 1
Linda B 2
Rares C 3
$ cat B.txt
1 A
2 B
3 C

join -1 <field nuber ของ file1> -2 <field number ของ file2> <file1> <file2>

$ join -1 2 -2 2 A.txt B.txt
A John 1 1
B Linda 2 2
C Rares 3 3

join -j<field nuber เดี่ยวกันทั้ง 2 file> <file1> <file2>

$ join -j 2 A.txt B.txt
A John 1 1
B Linda 2 2
C Rares 3 3

 

 

โครงสร้างคำสั่ง

 join [OPTION]... FILE1 FILE2

 

รายละเอียด

เป็นคำสั่งที่ใช้ในการเชื่อมข้อมูล 2 file ด้วย field ที่เหมือนกัน สามารถกำหนดเงื่อนไขของแต่ละ file ได้ไม่เหมือนกัน

 

Option

 -a FILENUM
 also print unpairable lines from file FILENUM, where FILENUM is 1 or 2, corresponding to FILE1 or FILE2

 -e EMPTY
 replace missing input fields with EMPTY

 -i, --ignore-case
 ignore differences in case when comparing fields

 -j FIELD
 equivalent to '-1 FIELD -2 FIELD'

 -o FORMAT
 obey FORMAT while constructing output line

 -t CHAR
 use CHAR as input and output field separator

 -v FILENUM
 like -a FILENUM, but suppress joined output lines

 -1 FIELD
 join on this FIELD of file 1

 -2 FIELD
 join on this FIELD of file 2

 --check-order
 check that the input is correctly sorted, even if all input lines are pairable

 --nocheck-order
 do not check that the input is correctly sorted

 --header
 treat the first line in each file as field headers, print them without trying to pair them

 -z, --zero-terminated
 line delimiter is NUL, not newline

 --help display this help and exit

 --version
 output version information and exit

 Unless -t CHAR is given, leading blanks separate fields and are ignored, else fields are separated by CHAR. Any FIELD is a field number counted from 1. FORMAT is one or more
 comma or blank separated specifications, each being 'FILENUM.FIELD' or '0'. Default FORMAT outputs the join field, the remaining fields from FILE1, the remaining fields from
 FILE2, all separated by CHAR. If FORMAT is the keyword 'auto', then the first line of each file determines the number of fields output for each line.

 Important: FILE1 and FILE2 must be sorted on the join fields. E.g., use "sort -k 1b,1" if 'join' has no options, or use "join -t ''" if 'sort' has no options. Note, comparisons
 honor the rules specified by 'LC_COLLATE'. If the input is not sorted and some lines cannot be joined, a warning message will be given.

 

กลุ่มคำสั่ง

comm(1), uniq(1)

 

Reference:

คำสั่ง Unix – Linux Command

Linux, Unix

 

Author: Suphakit Annoppornchai

Credit: https://saixiii.com

One Thought to “join – Linux Command คำสั่งเชื่อมข้อมูล 2 file ด้วย field ที่เหมือนกัน”

Leave a Reply