Удалить пустые колонки из CSV файл с bash-скрипт

Question

Удалить пустые колонки из CSV файл с bash-скрипт

ищет какой-то способ взглянуть на файл csv и удалить столбцы, включая заголовок, которые не имеют значений в последующих строках.

возможно, если бы я хотел удалить столбец Test03 снизу, включая Test03 в первой строке.

Test01,Test02,Test03,Test04  
11,22,,44  
11,22,,44  
11,22,,44  
11,22,,44  
11,22,,44  
11,22,,44

18

задан user1988900

05.01.2023 8:04 Количество просмотров материала

2570

7 ответов

85	51	26	60	4	7	9	5	3	17

Постоянная ссылка на данную страницу: [ Скопировать ссылку | Сгенерировать QR-код ]

Ваш ответ

Опубликуйте как Гость или авторизуйтесь

Имя

Email

Похожие вопросы про тегам:

bash

csv

linux

score 0 · Answer 1

в данном случае можно просто сделать:

sed 's/,,/,/g' test.csv > new.csv

это заменит все двойные запятые только на одну, фактически удалив пустой столбец. Обратите внимание, что столбец необходимо удалить из заголовка самостоятельно.

score 0 · Answer 2

Если вы хотите удалить, возможно, непустые столбцы (в том числе в заголовке), используйте команду "вырезать":

cut -d , -f 1,2,4 test.csv > new.csv

score 0 · Answer 3

если повторяющиеся пустые столбцы ,,,.
если пробелы в Столбцах 1, , ,,2 (start with/in middle/at the end).
If it's empty at first or end of a line ,123/123,

sed -E ':l;s/,[[:blank:]]*,/,/;tl;s/^[[:blank:]]*,|,[[:blank:]]*$//g'

score 0 · Answer 4

awk присоединяется к партии.

awk -F "," '{print ","","}' test.csv > new.csv

score 0 · Answer 5

это требует программы, а не быстрой команды. Лучшим способом сделать это было бы, как предложил Эндрю медико, использовать правильный CSV-парсер (в случае perl вы Text::CSV).

однако, я думал, что напишу perl скрипт, который работает в очень простых случаях:

perl -F, -lane 'if($.==1){@a=@F;next};for($i=0;$i<@F;$i++){if($F[$i]!=""){push @c,$F[$i];push @b,$i}}if(@a){foreach(@b){push @t,$a[$_]};print join(",",@t);undef @a}print join(",",@c);undef @c' file.csv

это сохраняет первую строку и идет дальше, чтобы увидеть, если есть какие-либо пустые поля в следующей строке. Затем он печатает только соответствующие заголовки, пропуская пустые поле во всех строках.

обратите внимание, что он не обрабатывает запятые внутри строк, заключенных в кавычки. Тем не менее, свою очередь:

Test01,Test02,Test03,Test04
11,22,,44
11,22,,44
11,22,,44
11,22,,44
11,22,,44
11,22,,44

в:

Test01,Test02,Test04
11,22,44
11,22,44
11,22,44
11,22,44
11,22,44
11,22,44

score 0 · Answer 6

при попытке различных подходов Баш мне нужно удалить все пустые столбцы (включая заголовок) надежно. Для решения этой проблемы я использовал Python с панды.

import pandas as pd

data = pd.read_csv('test.csv', sep='\t')
data.dropna(axis=1).to_csv('test_clean.csv')

здесь важно добавить axis=1 сказать Панде применить dropna к столбцам вместо строк.

score 0 · Answer 7

для обычного пользователя проще всего импортировать данные в Excel из этого CSV-файла и экспортировать их еще раз после удаления столбца.

Apple	$173,24	+0,81%
Amazon	$114,49	-1,94%
Microsoft	$325,19	+3,61%
Google	$123,44	+2,11%
Netflix	$364,74	-0,03%
Intel	$27,45	-5,34%
Facebook	$254,49	+2,11%
Tesla	$185,54	+1,44%
Tencent	$322,40	-3,01%