it-swarm-eu.dev

Comment supprimer les espaces blancs de fin avec sed?

J'ai un script simple Shell qui supprime les espaces de fin d'un fichier. Est-il possible de rendre ce script plus compact (sans créer de fichier temporaire)?

sed 's/[ \t]*$//' $1 > $1__.tmp
cat $1__.tmp > $1
rm $1__.tmp
92
Viktor

Merci à codaddict d’avoir suggéré le -i option.

La commande suivante résout le problème sur Snow Leopard

sed -i '' -e's/[ \t]*$//' "$1"
18
Viktor

Vous pouvez utiliser l'option in place -i de sed pour Linux et Unix:

sed -i 's/[ \t]*$//' "$1"

Sachez que l'expression supprimera les t de fin sur OSX (vous pouvez utiliser gsed pour éviter ce problème). Il peut aussi les supprimer sur BSD.

Si vous n'avez pas gsed, voici la syntaxe sed correcte (mais difficile à lire) sur OSX:

sed -i '' -E 's/[ '$'\t'']+$//' "$1"

Trois chaînes entre guillemets simples sont finalement concaténées en un seul argument/expression. Il n'y a pas d'opérateur de concaténation dans bash, il suffit de placer des chaînes les unes après les autres, sans espace entre elles.

Le $'\t' résout comme un caractère de tabulation littéral dans bash (en utilisant guillemet ANSI-C ), de sorte que la tabulation est correctement concaténée dans l'expression.

139
codaddict

Au moins dans Mountain Lion, la réponse de Viktor supprimera également le caractère 't' lorsqu'il se trouve à la fin d'une ligne. Les problèmes suivants résolvent ce problème:

sed -i '' -e's/[[:space:]]*$//' "$1"
55
acrollet

Il est préférable de citer également 1 $:

sed -i.bak 's/[[:blank:]]*$//' "$1"
13
Scrutinizer
var1="\t\t Test String trimming   "
echo $var1
Var2=$(echo "${var1}" | sed 's/^[[:space:]]*//;s/[[:space:]]*$//')
echo $Var2
4

Pour ceux qui recherchent l'efficacité (beaucoup de fichiers à traiter, ou de gros fichiers), utilisez le + opérateur de répétition au lieu de * rend la commande plus de deux fois plus rapide.

Avec GNU sed:

sed -Ei 's/[ \t]+$//' "$1"
sed -i 's/[ \t]\+$//' "$1"   # The same without extended regex

J'ai aussi rapidement comparé quelque chose d'autre: utiliser [ \t] au lieu de [[:space:]] accélère également considérablement le processus (GNU sed v4.4):

sed -Ei 's/[ \t]+$//' "$1"

real    0m0,335s
user    0m0,133s
sys 0m0,193s

sed -Ei 's/[[:space:]]+$//' "$1"

real    0m0,838s
user    0m0,630s
sys 0m0,207s

sed -Ei 's/[ \t]*$//' "$1"

real    0m0,882s
user    0m0,657s
sys 0m0,227s

sed -Ei 's/[[:space:]]*$//' "$1"

real    0m1,711s
user    0m1,423s
sys 0m0,283s
3
yolenoyer

J'ai un script dans mon .bashrc qui fonctionne sous OSX et Linux (bash seulement!)

function trim_trailing_space() {
  if [[ $# -eq 0 ]]; then
    echo "$FUNCNAME will trim (in place) trailing spaces in the given file (remove unwanted spaces at end of lines)"
    echo "Usage :"
    echo "$FUNCNAME file"
    return
  fi
  local file=$1
  unamestr=$(uname)
  if [[ $unamestr == 'Darwin' ]]; then
    #specific case for Mac OSX
    sed -E -i ''  's/[[:space:]]*$//' $file
  else
    sed -i  's/[[:space:]]*$//' $file
  fi
}

à quoi j'ajoute:

SRC_FILES_EXTENSIONS="js|ts|cpp|c|h|hpp|php|py|sh|cs|sql|json|ini|xml|conf"

function find_source_files() {
  if [[ $# -eq 0 ]]; then
    echo "$FUNCNAME will list sources files (having extensions $SRC_FILES_EXTENSIONS)"
    echo "Usage :"
    echo "$FUNCNAME folder"
    return
  fi
  local folder=$1

  unamestr=$(uname)
  if [[ $unamestr == 'Darwin' ]]; then
    #specific case for Mac OSX
    find -E $folder -iregex '.*\.('$SRC_FILES_EXTENSIONS')'
  else
    #Rhahhh, lovely
    local extensions_escaped=$(echo $SRC_FILES_EXTENSIONS | sed s/\|/\\\\\|/g)
    #echo "extensions_escaped:$extensions_escaped"
    find $folder -iregex '.*\.\('$extensions_escaped'\)$'
  fi
}

function trim_trailing_space_all_source_files() {
  for f in $(find_source_files .); do trim_trailing_space $f;done
}
2
Pascal T.

Juste pour le fun:

#!/bin/bash

FILE=$1

if [[ -z $FILE ]]; then
   echo "You must pass a filename -- exiting" >&2
   exit 1
fi

if [[ ! -f $FILE ]]; then
   echo "There is not file '$FILE' here -- exiting" >&2
   exit 1
fi

BEFORE=`wc -c "$FILE" | cut --delimiter=' ' --fields=1`

# >>>>>>>>>>
sed -i.bak -e's/[ \t]*$//' "$FILE"
# <<<<<<<<<<

AFTER=`wc -c "$FILE" | cut --delimiter=' ' --fields=1`

if [[ $? != 0 ]]; then
   echo "Some error occurred" >&2
else
   echo "Filtered '$FILE' from $BEFORE characters to $AFTER characters"
fi
1
David Tonhofer