Bash scripting: differenze tra le versioni
m (→Introduzione: correzione link) |
m (→Introduzione) |
||
Riga 1: | Riga 1: | ||
{{Versioni_compatibili}} | {{Versioni_compatibili}} | ||
=Introduzione= | =Introduzione= | ||
Questa non è una guida completa, per la vastità dell'argomento trattato. In particolare non sono trattati alcuni comandi importanti introdotti proprio da questa shell: | Questa non è una guida completa, per la vastità dell'argomento trattato. In particolare non sono trattati alcuni comandi importanti, alcuni introdotti proprio da questa shell: | ||
* di condizione ed esecuzione condizionata avanzata (<code>[[</code>, <code>((</code>, <code>case</code>); | * di condizione ed esecuzione condizionata avanzata (<code>[[</code>, <code>((</code>, <code>case</code>); | ||
* per effettuare il parsing degli argomenti (<code>getopts</code>); | * per effettuare il parsing degli argomenti (<code>getopts</code>); |
Versione delle 16:18, 21 lug 2014
Versioni Compatibili Tutte le versioni supportate di Debian |
Introduzione
Questa non è una guida completa, per la vastità dell'argomento trattato. In particolare non sono trattati alcuni comandi importanti, alcuni introdotti proprio da questa shell:
- di condizione ed esecuzione condizionata avanzata (
[[
,((
,case
); - per effettuare il parsing degli argomenti (
getopts
); - di redirezione here-document e di processo;
- modificatore declare (per interi, array e array associativi);
- ecc...
Lo scopo della guida è invece, partendo dai concetti più basilari, di evidenziare i comportamenti più distintivi e facili da sbagliare di bash, con enfasi particolare sulle espansioni di stringhe, estremamente diverse da altri linguaggi di programmazione. Così da passare poi a guide più avanzate. Si cercherà anche di presentare le istruzioni in una sintassi il più possibile compatibile con la shell sh.
Quando si fa riferimento a comandi esterni, per conoscere la loro sintassi si può consultare il manuale (man nome-comando-esterno
). La principale utilità dello scripting con la shell è proprio la semplicità di ampliarne le funzionalità richiamando altri eseguibili, quindi è consigliata anche la conoscenza dei principali (in particolare sulla gestione di file e directory).
Per l'uso interattivo della shell si rimanda invece a Bash tips. Si noti che l'espansione della history, che qui non è trattata, è attiva soltanto in modalità interattiva mediante i caratteri speciali !
e ^
, che di default non hanno invece nessun significato particolare all'interno di uno script.
Breve storia della shell
GNU bash (Bourne-Again SHell) è una delle shell derivate da sh (la Bourne shell, progettata da Stephen Bourne), la prima progettata per lo scripting. Bash è la scelta di default per l'uso interattivo su Debian e molte distribuzioni GNU/Linux, il che la rende una delle più diffuse, e incorpora molte nuove funzionalità rispetto a sh, alcune derivanti da altre shell (csh e ksh) e altre presenti soltanto in bash.
Quando si scrivono script con questa shell bisogna sapere che le nuove funzionalità comportano un costo, in termini di portabilità, rispetto agli script che si limitano alla sola sintassi prevista da POSIX, lo standard che specifica come scrivere applicazioni funzionanti su tutti i sistemi UNIX e che per la shell prescrive le sole istruzioni supportate da sh. Infatti uno script scritto per sh secondo lo standard POSIX sarà supportato anche da altri sistemi operativi della famiglia UNIX e Unix-like che non hanno bash installato di default, come per esempio quelli della famiglia *BSD, a patto che anche i comandi esterni e le loro opzioni siano scelte secondo lo standard.
Inizialmente bash era usata anche per gli script di sistema (con /bin/sh
che puntava a /bin/bash
), ma per questa funzione è stata rimpiazzata da dash (Debian Almquist Shell): più veloce, con meno dipendenze di librerie e aderente molto più strettamente a POSIX.
Per quanto possibile in questa guida, in presenza di sintassi alternative, si tenderà a prediligere quella presente in POSIX e si segnalerà ogni volta che un'istruzione è presente unicamente in bash.
Come creare uno script
Uno script, per poter essere eseguito come un eseguibile qualsiasi, in ambiente UNIX e Unix-like deve:
- avere il bit di esecuzione attivo;
- iniziare con due caratteri:
#!
(shebang).
Questo specifica che il file è uno script, ossia non è compilato e direttamente eseguibile, e va eseguito indirettamente invocandone l'interprete con il percorso e le eventuali opzioni scritte sulla stessa riga dello shebang.
Per scrivere uno script in bash basta quindi creare un file con la prima riga che faccia riferimento al percorso della shell:
#! /bin/bash
È consigliato inoltre di determinare esplicitamente il valore di ritorno (exit status) di uno script, facendolo terminare con l'istruzione exit
seguita dall'exit status, che è un valore intero compreso tipicamente tra 0 (l'unico valore per successo) e 255. In assenza di tale istruzione il valore di ritorno dello script sarà determinato dall'exit status dell'ultimo comando eseguito.
Inoltre è bene sapere che l'esecuzione di uno script in bash, così come uno in sh (POSIX), di default non è interrotta in presenza di errori. È importante quindi controllare l'exit status dei comandi eseguiti, se possono fallire, con if
oppure con gli operatori logici di concantenazione &&
e ||
, che saranno introdotti.
Fa eccezione l'istruzione exec
che, se seguita da un eseguibile esterno (anche un altro script), fa eseguire al processo corrente il nuovo eseguibile. Le istruzioni successive nello script non verranno eseguite, e il valore di uscita dello script è determinato da quello del nuovo eseguibile.
Commenti
È considerato commento tutto ciò che segue il carattere #
fino alla nuova riga, purché #
non sia racchiuso tra virgolette, apici o preceduto da \
, in tal caso mantiene il suo valore letterale.
I commenti sono ovviamente ignorati dall'interprete, ma rendono più leggibile il codice.
Si noti che lo stessa shebang introduce una riga di commento, così da poter essere riconosciuta dal sistema grazie al sistema dei magic pattern e allo stesso tempo essere ignorata dall'interprete.
Il primo script
Esempio di classico programma che si limita a stampare "Hello world!" sullo schermo:
#! /bin/bash printf %s\\n "Hello world!" exit 0
Rendere eseguibile uno script
Una volta scritto lo script, non resta che attivarne il bit di esecuzione. Supponendo si chiami script.sh, da un terminale dare:
$ chmod +x script.sh
E dalla directory in cui si trova è possibile eseguirlo dal terminale con:
$ ./script.sh
Debug integrato
Bash, proprio come dash (la cui sintassi è limitata quasi soltanto alla shell POSIX), ha delle opzioni che ne consentono il debug.
Invocando uno script con -n
è possibile effettuare un primitivo controllo di sintassi. Non vengono controllati comandi inesistenti e nemmeno le espansioni, ma può essere utile per verificare che i blocchi sono stati chiusi correttamente prima di eseguire lo script:
$ bash -n script.sh
Altre opzioni utili, che possono essere impiegate anche congiuntamente durante l'esecuzione:
-x
stampa ogni comando prima di eseguirlo;-v
stampa l'intero blocco di codice che è stato letto (solo la prima volta);-u
interrompe lo script se si accede a una variabile mai assegnata;-e
interrompe lo script in caso di errore (se il comando non è controllato da unif
,while
o dalla concatenazione con||
).
E possono essere usate anche dopo lo shebang nella prima riga dello script. Per esempio:
#! /bin/bash -e
Comandi essenziali
I comandi introdotti in questa sezione sono descritti solo limitatamente alla loro sintassi base, così che il loro impiego nelle sezioni successive possa essere facilmente compreso.
La lettura della sezione può essere tralasciata, se si hanno già nozioni basilari di bash, ma la parte sui comandi di output serve anche a giustificare la scelta di printf
in luogo del più noto echo
come unico comando di output e a spiegarne brevemente la sintassi, almeno per le invocazioni più comuni.
Comandi di output: echo e printf
Il comando echo
è largamente diffuso in Bash per stampare delle stringhe su schermo, perché ha una sintassi più semplice di printf
e non risente delle stesse limitazioni della shell sh (POSIX), che interpreta ed espande i caratteri di escape (si legga la sezione dedicata) senza che ci sia un modo di stampare letteralmente una stringa (non nota a priori).
Tuttavia negli script l'uso di echo
non è sempre possibile, rendendo necessaria la conoscenza almeno basilare di printf
. In particolare, se si vuole stampare il contenuto di $var, non è sempre corretto scrivere:
echo -n "$var" # stampa senza a capo finale echo "$var" # stampa con a capo finale
perché $var potrebbe iniziare con il carattere "-
" ed essere una combinazione delle opzioni: -e, -E, -n.
Con echo
non esiste un modo che assicuri la stampa del contenuto di una variabile in ogni situazione possibile. E non sempre il contenuto è noto a priori: in presenza di espansioni, come vedremo poi, o di input dell'utente. Per non incorrere in errori difficili da riconoscere, echo
andrebbe usato soltanto nella shell interattiva, dove l'uso è più comodo, e printf
andrebbe preferito anche in Bash per gli script, perché ha una sintassi più robusta.
In questa guida d'ora in poi si farà riferimento soltanto a printf
.
Uso di printf
Sintassi: printf formato [ "stringa" ... ]
Gli usi più avanzati non sono trattati in questa guida, ma di seguito sono presentati alcuni esempi:
- stampa sullo schermo senza a capo finale
printf %s "stringa da stampare" printf %s "$var"
- stampa una riga vuota
printf \\n # corretto (doppio backslash) printf \n # ERRORE: stampa 'n' # tra virgolette printf "\\n" # corretto (doppio backslash) printf "\n" # corretto (singolo backslash) # tra apici printf '\\n' # ERRORE: stampa '\n' printf '\n' # corretto (singolo backslash)
- altri caratteri speciali nel formato (stesse considerazioni sull'uso di " e ')
printf \\t # tabulazione printf \\r # ritorno a inizio riga printf \\NNN # stampa il carattere ascii con codice in base 8
- stampa sullo schermo con a capo finale
printf %s\\n "stringa da stampare" printf %s\\n "$var"
- stampa con a capo prima e dopo
printf \\n%s\\n "stringa"
Mai stampare una stringa e ancora peggio una variabile senza farla precedere dal formato:
printf "stringa" # ERRORE: le sequenze speciali inizianti in \ e % verrebbero interpretate! printf "$var" # ERRORE: come sopra printf %s "stringa" # corretto printf %s "$var" # corretto
Per usi più complessi, anziché rendere più complicato il formato, è preferibile utilizzare più comandi printf
:
# funziona, ma è poco chiaro per chi non ne conosce la sintassi printf '%s\n\t%s %s\n' "Sintassi:" "$0" "[ arg ]" # più stringhe # equivalente, ma più leggibile: printf %s\\n "Sintassi:" printf '\t%s\n' "$0 [ arg ]"
Condizioni
Le condizioni nella shell dipendono dal valore di uscita (exit status) di un comando. Si considera successo un exit status corrispondente a 0, ed è equivalente a una condizione vera/soddisfatta, mentre fallimento un exit status con valori diversi da zero, e sono equivalenti a una condizione falsa/non soddisfatta.
Il significato dell'exit status di un comando (successo/fallimento) può essere invertito facendolo precedere da un punto esclamativo (!
).
Alcuni comandi hanno un exit status predeterminato:
:
o (equivalentemente)true
hanno un exit status sempre di zero (successo/vero);false
ha un exit status sempre diverso da zero (fallimento/falso).
Per esempio:
: # exit status 0 true # equivalente ! : # exit status diverso da 0 false # exit status diverso da 0 ! false # exit status 0
Espressioni booleane
Le espressioni booleane più basilari, ereditate da POSIX, si possono esprimere con i comandi test
e [
. L'unica differenza tra i due è che il secondo richiede ]
come ultimo argomento, ed è preferibile per questioni di leggibilità del codice. D'ora in poi infatti si considera soltanto [ ... ]
, e in questa sezione vengono descritte solo le forme più basilari. Per tutte le opzioni supportate si rimanda all'aiuto integrato (help test
).
[...]
restituisce un exit status di 0 (successo/vero) se la condizione contenuta all'interno è vera, e 1 (fallimento/falso) altrimenti. È molto utile all'interno di istruzioni più complesse, come if
per l'esecuzione condizionata e while
per eseguire cicli.
Confronti unari con stringhe (tipicamente l'espansione di variabile o parametro):
[ -z "$var" ]
: vero se var contiene una stringa di lunghezza zero o non è definita;[ -n "$var" ]
: vero se var contiene una stringa che non ha lunghezza zero.
Confronti binari tra stringhe (possono essere anche entrambe variabili):
[ "$var" = "stringa" ]
: vero se il contenuto di var è uguale alla stringa;[ "$var" != "stringa" ]
: vero se è diverso.
Confronti binari tra stringhe contenenti interi (possono essere anche entrambe variabili):
[ "$var" -gt valore ]
: (greater than) vero se l'intero contenuto nella variabile è maggiore del valore dato;[ "$var" -ge valore ]
: (greater or equal to) vero se l'intero contenuto nella variabile è maggiore o uguale al valore dato;[ "$var" -lt valore ]
: (lower than) vero se l'intero contenuto nella variabile è inferiore del valore dato.[ "$var" -le valore ]
: (lower or equal to) vero se l'intero contenuto nella variabile è inferiore o uguale al valore dato.
Se una delle due stringhe non è un intero, anche negativo, il confronto fallisce e può esserci la stampa di un messaggio d'errore sullo standard error. Per evitarlo va aggiunto 2> /dev/null
(il significato di tale redirezione sarà trattato in seguito). Per esempio:
[ "$var" -gt 0 ] 2> /dev/null # non stampa errori se $var non è un intero
Confronti unari con stringhe contenenti percorsi di file (percorso di default: directory corrente, se mancante):
[ -e "$var" ]
: vero se il file (file regolare, directory, link simbolico, fifo, socket, ... ) esiste;[ -f "$var" ]
: vero se il file esiste ed è un file regolare;[ -d "$var" ]
: vero se il file esiste ed è una directory.
Le espressioni più complesse si possono comporre utilizzando gli operatori logici &&
e ||
per aggregare più istruzioni [...]
, e le parentesi { ... ; }
per determinarne la priorità, come si vedrà nella parte sui blocchi di istruzioni.
Esecuzione condizionata
Per eseguire un blocco di comandi soltanto se una condizione è soddisfatta si utilizza if
, solitamente in combinazione con [...]
.
La sua sintassi base (in congiunzione con [...]
) è:
if [ espressione-booleana ]; then ... [ elif [ espressione-booleana ]; then ... ] ... [ else ... ... ] fi
Per esempio:
if [ -z "$var" ]; then printf %s\\n "La variabile var è nulla!" elif [ "$var" = "pluto" ]; then printf %s\\n "La variabile var contiene pluto" else printf %s\\n "La variabile var non è nulla e non contiene pluto, ma: ${var}" fi
Controllo degli errori
Si ricordi che if
accetta un comando qualsiasi come condizione, valutandone l'exit status ed eseguendo il ramo then
se ha successo, e quello elif
/else
immediatamente successivo (se presente) altrimenti. Quindi è un ottimo strumento anche per controllare che un comando venga eseguito senza errori, permettendo anche la terminazione immediata dello script:
if comando; then printf %s\\n "Comando riuscito!" else printf %s\\n "ERRORE: comando fallito!" # esci con errore (exit status 1) exit 1 fi
e se si è interessati al solo ramo else, basta utilizzare !
prima del comando:
if ! comando; then exit 1 fi
Variabili (stringhe)
In bash ogni variabile di default è trattata come una stringa e, benché siano supportati anche interi e array (indicizzati o associativi), questa guida si limita al solo tipo base.
Nomi di variabili
Un nome di variabile ammette soltanto caratteri alfabetici (maiuscoli e minuscoli), l'underscore ('_') e numeri (non in prima posizione). E il suo contenuto si accede con ${nome}
oppure con la forma abbreviata $nome
.
La forma abbreviata assume che il nome della variabile sia composto da tutti i caratteri validi incontrati. Per esempio la concatenazione "$nome$cognome"
è equivalente a "${nome}${cognome}"
, ma "$nome_$cognome"
non lo è a "${nome}_${cognome}"
perché nome_
(con underscore finale) sarebbe un nome valido.
Assegnazioni
Non si deve usare il $
davanti alla variabile a cui assegnare. La forma consigliata, salvo necessità particolari, è quella tra virgolette per le stringhe e le concatenazioni di stringhe e variabili, e senza virgolette per una singola variabile:
var="stringa" var=$var2 # senza virgolette var=${var2} # equivalente a sopra var="$var2" # come sopra var="${var1} testo ${var2}" # con virgolette
Altre forme sono possibili, e il loro significato è trattato in seguito:
var=stringa # assegno una stringa (senza spazi e caratteri speciali) var=$'stringa con escape' # come sopra, ma con caratteri di escape e senza espansioni var='stringa senza apici' # niente espansioni, né caratteri di escape # espansioni... var=$(comando) # assegna l'output del comando var=$(($n * 10)) # assegna il risultato dell'operazione var=~utente # assegna la home di utente
Modificatori
Sono comandi interni che possono essere applicati soltanto a un nome di variabile (senza $) o a un'assegnazione, e in quest'ultimo caso hanno effetto sulla variabile dopo l'avvenuta assegnazione.
- export
- specifica che la variabile farà parte delle variabili d'ambiente (environment) dei comandi esterni eseguiti dallo script:
var="stringa" export var # equivalente a: export var="stringa" # comando esterno comando # può accedere al contenuto di var
È possibile definire una o più variabili nell'ambiente di un comando, senza farle ereditare a quelli successivi, semplicemente scrivendo le assegnazioni prima del nome del comando. Per esempio:
var="stringa" comando # può accedere al contenuto di var printf %s\\n "$var" # $var è vuota!
- readonly
- specifica che la variabile (per convenzione scritta con caratteri maiuscoli) è di sola lettura e dev'essere trattata da quel punto in poi come una costante:
VAR="valore" readonly VAR # equivalente a: readonly VAR="valore" VAR="altro valore" # ERRORE! var ora è una costante
Per convenzione le costanti sono poste tutte all'inizio dello script, prima anche di eventuali definizioni delle funzioni.
Assegnazione dallo standard input
Con l'istruzione read
è possibile assegnare a una o più variabili il contenuto di una riga dello standard input, che senza redirezioni e pipe corrisponde a ciò che viene scritto da tastiera prima di un invio.
Sintassi (base): read nomevariabile [ ... ]
Il nome delle variabili non va preceduto da $, proprio come nelle assegnazioni normali. Se sono presenti più nomi di variabile, la riga letta si divide in stringhe delimitate dai caratteri contenuti in $IFS
(di default sono tre: spazio, tabulazione e invio), ma all'ultima variabile viene sempre assegnato tutto il contenuto rimanente fino a fine riga.
Esempio:
printf %s "Scrivi qualcosa e premi invio: " read testo printf %s\\n "Hai scritto: ${testo}"
Assegnazione con ciclo
Con l'istruzione for
è possibile eseguire un blocco di istruzioni per ogni elemento di una lista di stringhe, assegnando un elemento per volta a una variabile.
Sintassi (base):
for nomevariabile [ in ... ] do ... done
Al solito il nome della variabile non va preceduto da $. Se la parola riservata in
e la lista di stringhe sono omesse, allora è equivalente a: in "$@"
Due modi tipici per generare una lista di stringhe sono:
- con la variabile speciale
"$@"
, l'unica che se quotata si espande a una lista di stringhe; - con l'espansione di percorso, che sarà trattata in seguito;
Per esempio:
for file in /percorso/*.txt do if [ -e "$file" ]; then # blocco eseguito su ciascun file .txt in /percorso/ tramite "$file" ... fi done
Il ciclo for
può essere:
- interrotto dall'istruzione
break
; - continuato saltando la corrente iterazione del ciclo con
continue
, che passa al prossimo elemento della lista, se presente, altrimenti esce.
Espansione di variabile
Con l'unica eccezione dell'assegnazione, quando si accede al contenuto di una variabile senza quotarla, questa può essere trasformata in più di una singola stringa (esplosione) in base agli spazi (e tabulazioni e "a capo") contenuti, e perfino in "niente" se è vuota. "Niente" proprio come se non presente nel codice.
Entrambi i comportamenti non sono intuitivi e costituiscono una comune sorgente di errori. Se si vuole sempre considerare il contenuto della variabile come una singola stringa, è necessario accederla quotata (tra virgolette), ossia con "$variabile"
oppure "${variabile}"
.
Si considerino per esempio i seguenti confronti (usati spesso con if
o while
):
[ $var = $var2 ] # SBAGLIATO! (se una delle due è vuota) [ "$var" = "$var2" ] # corretto [ -n $var ] # SBAGLIATO (se var è vuota) [ -n "$var" ] # corretto
Ciò è ancora più importante quando si passa la variabile a un comando che agisce su un file indicato dalla variabile, il cui contenuto in presenza di spazi (comuni per i nomi di file degli utenti) potrebbe venir trattato come una lista di file.
Esempio di codice che crea un backup di un file indicato da una variabile (tramite il comando esterno cp
):
cp -- "$file" "${file}.bak"
D'altra parte accedere una variabile senza quotarla permette di assegnare alla variabile tutte le opzioni da passare a un comando, se sono stringhe senza spazi e caratteri speciali che potrebbero essere espansi nuovamente (* ? [ ]
), per poi accederle in una volta sola:
ARGUMENTS="--arg1 --arg2 ..." ... comando $ARGUMENTS
Si noti che usando "$ARGUMENTS"
(quotata) per una variabile contenente la stringa vuota, il comando leggerebbe lo stesso un argomento e potrebbe fallire.
Variabili speciali
$?
- contiene il valore di uscita dell'ultimo comando o funzione (0 solo in caso di successo);
$0
- contiene il nome usato per lanciare lo script;
$#
- contiene il numero di argomenti passati allo script (o a una funzione, all'interno di una funzione);
$1, $2, ...
- contengono, se presenti, i parametri passati allo script (o a una funzione);
$@
- contiene la lista di tutti i parametri passati allo script corrente o a una funzione. Ogni parametro viene opportunamente quotato, se questa variabile è quotata, e questo ne permette l'utilizzo nei cicli for per processare (ad esempio) una lista di nomi di file che possono contenere anche spazi. L'uso di questa variabile è quindi in genere preferito rispetto a
$*
che ha la stessa funzione ma, se quotata, non quota i vari parametri ma l'intera stringa;
Esempio:
for file in "$@" do # fare quello che si vuole con "$file" ... done
$$
- PID del processo corrente;
$!
- PID dell'ultimo job in background.
Esempio:
comando & # lancio un comando in background pid=$! # ottengo il PID del comando ... # eseguo altre operazioni wait $pid # attendo la terminazione del comando status=$? # catturo il suo exit status
Caratteri di escape, apici e virgolette
Alcuni caratteri hanno un valore speciale per la shell, per consentire le espansioni o determinati costrutti. Di conseguenza se si intende scrivere il carattere per il suo valore letterale, è necessario comunicarlo alla shell facendolo precedere da un carattere di escape '\
' oppure racchiudendolo tra apici o virgolette.
Una stringa non racchiusa tra apici o tra virgolette ha i seguenti caratteri speciali: $ ' ` " \ { } [ ] * ? ~ & ; ( ) < > | #
In determinate circostanze, se non preceduti dal carattere di escape \
, possono essere: espansi, eseguiti in background, considerati parte di un nuovo comando, trattati come redirezioni e perfino come commenti. Questa sezione non è esaustiva e non considera tutte le eccezioni, ma consiglia degli accorgimenti che si possono sempre seguire per ridurre il numero di caratteri speciali.
Inoltre gli spazi (comprese le tabulazioni) non quotati con apici o virgolette, e non preceduti dal carattere di escape \
, vengono compressi e ciò che è scritto prima o dopo è interpretato come appartenente a stringhe diverse.
Per esempio:
printf %s\\n parola1; parola2 # ERRORE: parola2 è considerata un altro comando! printf %s\\n "parola1; parola2" # corretto printf %s\\n parola1 parola2 # ERRORE: niente spazi e su due righe diverse! printf %s\\n "parola1 parola2" # corretto # con una variabile var="parola1 parola2" # assegno la stringa alla variabile printf %s\\n $var # ERRORE: stampa le parole su due linee diverse printf %s\\n "$var" # stampo la stringa così com'è scritta
Il carattere di escape \
prima di un "a capo", anche se quotato (tra virgolette), ha un significato speciale che consente di scrivere un comando su più righe, trattando ogni riga preceduta da \
come una continuazione della precedente:
# stampa tutto su una riga printf %s\\n "testo su \ più \ righe" # stampa su più righe printf %s\\n "testo su più righe"
Racchiudere tra apici
Con gli apici (apostrofi) si riducono i caratteri speciali a uno soltanto, lo stesso apice, rappresentando la stringa per il suo solo valore letterale e impedendo tutte le espansioni:
printf %s\\n '$PATH "" \ `ls ..` \$HOME ~ * .[a-z]*' # stampa la stringa tra apici, letteralmente
Lo svantaggio è che non esiste un carattere di escape:
printf %s\\n 'L'\''albero di... ' # stampa "L'albero di..." (l'accento non può essere racchiuso tra apici)
Racchiudere tra $'...'
Una stringa racchiusa tra $'...'
non può essere espansa in nessun modo, come se fosse racchiusa tra apici. Il carattere \
resta un carattere di escape, quindi è possibile inserire un apice nella stringa facendolo precedere da \
e dev'essere preceduto dal carattere di escape anche ogni \
da stampare letteralmente.
Un carattere \
non preceduto da escape permette di stampare caratteri di escape, con la stessa sintassi del formato di printf
(quando racchiuso tra apici):
- \n, nuova riga;
- \b, backspace (cancella un carattere);
- \r, carriage return (ritorna a inizio riga);
- \t, tabulazione;
- \nnn, carattere ASCII in base 8;
- ecc...
Per esempio:
printf %s\\n $'stringa' # stampa la stringa printf %s $'stringa\n' # equivalente: il carattere "a capo" ora è nella stringa printf %s $'$PATH "" `ls ..`\n' # nessuna espansione printf %s $'~ * .[a-z]*\n' # nessuna espansione printf %s $'{a,b,c} $((2*2))\n' # nessuna espansione printf %s $'escape: \\\n' # per stampare un \ dev'essere preceduto da \ printf %s $'L\'albero di...\n' # stampa "L'albero di..." (l'apice può essere stampato con escape)
È un metodo molto meno diffuso rispetto a racchiudere tra apici e virgolette, perché non derivata da sh (POSIX).
Quotare (tra virgolette)
Racchiudere tra virgolette ogni stringa è raccomandabile, anche se non sempre necessario, così da ridurre il numero di caratteri speciali a cui pensare, permettendo allo stesso tempo l'espansione sicura delle variabili e dei comandi. I soli caratteri speciali rimasti sono $
, `
(ma non l'apice), "
e \
, che devono essere preceduti dal carattere di escape \
.
All'interno di una stringa quotata tutte le espansioni che non sono attivabili da $
non sono permesse. Sono possibili soltanto le espansioni di variabile/parametro, di comando e aritmetiche.
Per esempio:
printf %s\\n "$PATH" # espande la variabile PATH e ne stampa il contenuto printf %s\\n "\$HOME" # stampa letteralmente $HOME, senza espanderla (è equivalente a '$HOME') printf %s\\n "\"\" \\" # è equivalente a '"" \' printf %s\\n "$(ls ..)" # Esegue il comando "ls .." e ne stampa l'output printf %s\\n "$((2*2))" # Esegue l'espressione aritmetica e stampa 4 printf %s\\n "~ * .[a-z]*" # non effettua le espansioni di tilda e percorso, ma stampa letteralmente printf %s\\n "p{a,b,c}s" # niente espansioni
Espansioni in stringhe quotate
Le espansione attivate da $
avvengono con la stessa priorità, e in una stringa quotata sono le uniche permesse, quindi il risultato di un'espansione non può mai essere espanso un'altra volta. Sono permesse le sole espansioni di variabile, già vista, e di parametro, di comando e aritmetica (intera), che saranno trattate in seguito.
Espansione di parametro (stringa)
È una forma modificata dell'espansione di variabile, che permette di operare sulla stringa contenuta con un modificatore.
L'espansione di parametro è utilizzabile ogni volta che lo è quella di variabile, con un'unica differenza: l'espansione di variabile può essere contenuta in alcune espansioni di parametro, purché non al posto del nome della variabile, mentre non è mai possibile annidare più espansioni di parametro.
Modificatori:
${#var}
ritorna il numero di caratteri della stringa contenuta in $var. Espande sempre a una singola stringa;${!var}
(non POSIX) ritorna il contenuto della variabile, il cui nome è contenuto in $var (accesso indiretto);- espande o assegna valori di default/alternativi;
- manipolatori di stringa (rimozione, sostituzione, trasformazione in uppercase/lowercase).
Esempio:
var="stringa" rif="var" # rif contiene il nome (senza $) di $var var2=${!rif} # equivalente a: var2=$var printf %s\\n "$var2" # stampa: stringa printf %s\\n ${#var2} # stampa: 7 (la lunghezza di "stringa")
Manipolazione delle stringhe
Per manipolare una stringa, è possibile assegnarla a una variabile per poi effettuarne un'espansione di parametro che manipola la stringa, senza modificare il contenuto della variabile. Per esempio:
VAR="stringa-di-esempio" printf %s\\n "${VAR#stringa-}"
ritorna il contenuto della variable VAR senza il prefisso "stringa-". VAR non viene modificata, salvo una nuova assegnazione:
VAR=${VAR#stringa-}
ora il prefisso "stringa-" è stato eliminato anche dalla variabile VAR.
I modificatori sono molti, ma possono essere facilmente ricordati se si imparano i fondamentali:
#
sottrae dall'inizio della stringa (minimale);%
sottrae dalla fine della stringa (minimale);/
(non POSIX) sostituisce una sottostringa con un'altra (solo la prima volta che viene incontrata);^
(non POSIX) trasforma in maiuscola la prima lettera della stringa (solo il primo carattere);,
(non POSIX) trasforma in minuscola la prima lettera della stringa (solo il primo carattere).
Questi operatori sono minimali, questo vuol dire che se si usano le espressioni regolari per indicare la sottostringa (da eliminare, sostituire o trasformare) verrà individuata in caso di ambiguità la sottostringa più piccola (o solo la prima nel caso di sostituzione o trasformazione).
Per ottenere gli operatori massimali basta raddoppiare il simbolo:
##
sottrae dall'inizio della stringa (massimale);%%
sottrae dalla fine della stringa (massimale);//
(non POSIX) sostituisce una sottostringa con un'altra (tutte le volte che viene incontrata);^^
(non POSIX) trasforma in maiuscola la stringa (tutta);,,
(non POSIX) trasforma in minuscola la stringa (tutta).
Gli operatori massimali cercano di individuare la sottostringa più grande che corrisponde all'espressione regolare, mentre nel caso del modificatore // tutte le sottostringhe vengono sostituite, e nel caso della trasformazione tutta la stringa e non solo il primo carattere.
Si noti che le stringhe interne a un'espansione di parametro possono essere delle variabili, ma non altre espansioni di parametro:
# cambia l'estensione nella variabile file if [ "$file" != "${file%${estensione}}" ]; then file=${file%${estensione}}${nuova_estensione} fi
Le espressioni regolari supportate sono le stesse permesse nelle espansioni di parametro e con lo stesso significato (ossia: ? * [ ]
), e con gli operatori di sottrazione c'è differenza tra quelli minimali e massimali soltanto se il pattern contiene uno o più *
, che è l'unico carattere speciale che può sostituire un numero qualsiasi (zero o più) di caratteri.
Esempio: alternativa a basename
Quando in uno script ci si deve riferire al nome dello script stesso, è usuale utilizzare il comando esterno basename
. Una possibile alternativa:
usage () { printf %s\\n "Usage: ${0##*/}" }
Esempi: manipolazione delle stringhe
VAR="questa.sarebbe.UNA.stringa.di.esempio" # Risultato: printf %s\\n "${VAR#*.}" # sarebbe.UNA.stringa.di.esempio printf %s\\n "${VAR##*.}" # esempio printf %s\\n "${VAR%.*}" # questa.sarebbe.UNA.stringa.di printf %s\\n "${VAR%%.*}" # questa printf %s\\n "${VAR/st/LL}" # queLLa.sarebbe.UNA.stringa.di.esempio printf %s\\n "${VAR//st/LL}" # queLLa.sarebbe.UNA.LLringa.di.esempio printf %s\\n "${VAR^*}" # Questa.sarebbe.UNA.stringa.di.esempio printf %s\\n "${VAR^^*}" # QUESTA.SAREBBE.UNA.STRINGA.DI.ESEMPIO printf %s\\n "${VAR,*}" # questa.sarebbe.UNA.stringa.di.esempio (invariata) printf %s\\n "${VAR,,*}" # questa.sarebbe.una.stringa.di.esempio
Per una spiegazione dettagliata di tutti i modificatori e anche di altri modi di manipolare le stringhe in Bash (ad esempio expr
) vedere:
Espansione di comando
Consiste nel trasformare l'output di un comando qualsiasi (interno della shell, esterno, una funzione e anche forme composte) in argomenti per un altro comando, oppure nel valore da assegnare a una variabile. Si effettua racchiudendo un comando tra $(...)
:
$(comando)
oppure, meno leggibile e sconsigliata tra `...`
(su tastiera con layout italiano: Alt Gr + '
):
`comando`
Inoltre la prima forma può essere annidata facilmente, mentre la seconda richiederebbe un livello aggiuntivo di escape.
L'output del comando consiste in zero, una o più stringhe: in base agli spazi presenti nell'output prodotto, e in maniera analoga all'espansione a cui sono soggette le variabili. Per trasformare l'output di un comando in una singola stringa è necessario che l'espansione di comando sia quotata, con l'eccezione dell'assegnazione a una variabile.
Esempi di assegnazione:
# assegna alla variabile $oggi la data in formato YYYY_MM_DD oggi=$(date '+%F') # senza virgolette oggi="$(date '+%F')" # equivalente a sopra (non servono nelle assegnazioni) # associo a testo la dimensione in bytes di $file testo=$(wc -c -- $file) # SBAGLIATO! (se la variabile $file contiene spazi o caratteri speciali) testo=$(wc -c -- "$file") # le virgolette attorno alla variabile sono necessarie testo="$(wc -c -- "$file")" # equivalente a sopra # testo contiene anche altre stringhe, ma sono interessato solo alla prima bytes=${testo%% *} # estraggo il primo argomento (espansione di parametro)
Passaggio dell'output dei comandi come argomento:
# stampa stati printf %s\\n "Login name: $(logname); Name: $(whoami); UID: $(id -ur); EUID: $(id -u); Groups: $(groups)" printf %s\\n "OS: Debian GNU/Linux $(cat /etc/debian_version) ($(lsb_release -sc))" # uguale a $(lsb_release -sd) printf %s\\n "Kernel: $(uname) $(uname -r) ($(uname -v))"
Output con a capo finali
Si noti che l'espansione di comando, come anche in sh (POSIX), non espande il comando a tutto l'output prodotto, ma omette sempre gli "a capo" finali. Se da una parte è utile nella maggior parte delle situazioni, può talvolta avere effetti collaterali difficili da prevedere. Si consideri per esempio:
printf %s\\n ciao > ./file_prova # scrive ciao e un "a capo" nel file_prova testo=$(cat ./file_prova) # associa il contenuto (SENZA "a capo") a $testo printf %s\\n "Bytes: ${#testo}" # NON è la dimensione esatta del file! printf %s\\n "$testo" | # invia la stringa a cmp (più un "a capo") per un confronto cmp - ./file_prova # nessun errore!!! printf %s\\n $? # infatti stampa 0
Un altro esempio, vogliamo associare il carattere "a capo" a una variabile:
nr=" " # funziona, ma occupa più righe e rompe l'indentazione nr=$'\n' # funziona (non POSIX) ed è il modo consigliato in bash # a titolo esemplicativo per l'espansione di comando nr=$(printf \\n) # SBAGLIATO, $nr è vuota nr="$(printf \\n)" # SBAGLIATO, $nr è sempre vuota # una possibile soluzione (POSIX) nr=$(printf \\n%s X) # $nr contiene "a capo" seguito da X nr=${nr%X} # $nr contiene "a capo" (la X è rimossa) # Attenzione che il carattere aggiunto dev'essere nell'output del comando nr="$(printf \\n)X" # SBAGLIATO, $nr contiene solo X
Espansione aritmetica intera
Permette di compiere operazioni aritmetiche tra interi, ritornando sempre una singola stringa contenente l'intero risultante. Può essere quotata, ma non cambia niente.
La sintassi è: $((...))
All'interno delle parentesi è possibile utilizzare:
- le quattro operazioni:
+ - * /
- resto/modulo:
%
- potenza:
**
- variabili da espandere (contenenti valori interi)
- parentesi per cambiare le priorità degli operatori:
( )
Esempio:
base=9 altezza=5 area=$(($base * $altezza)) printf %s\\n "Area rettangolo: ${area}" # Stampa 45 printf %s\\n "Area triangolo: $(($area / 2))" # Stampa 22 (RICORDA: solo interi)
Espansioni non quotabili
Le espansioni trattate nelle sezioni successive avvengono unicamente in stringhe non quotate, almeno limitatamente ai caratteri speciali che le attivano, e sono attivabili soltanto da caratteri diversi dal $.
Le loro priorità sono tutte diverse: l'espansione di parentesi è quella maggiore, seguita dalla tilda, da tutte le espansioni attivabili con $ (quelle quotabili) e infine dall'espansione di percorso.
Inoltre l'espansione di tilda, che è sempre espansa in una singola stringa, è l'unica possibile in un'assegnazione tra le espansioni non quotabili.
Espansione di tilda
Sintassi:
~
si espande alla home, se non è quotata (equivalente all'uso di $HOME, che può essere quotata);~utente
si espande alla home di un dato utente, se esiste, ma la stringa non può essere quotata né essere una variabile.
Si distingue dall'espansione di percorso perché:
- si espande sempre a una singola stringa;
- può essere espansa in un'assegnazione, se non è quotata;
- ha priorità maggiore delle espansioni quotabili; per cui, se assegnata quotata a una variabile, non sarà espansa quando si accede alla variabile.
Esempi:
var=~ # assegno la home dell'utente a $var var=$HOME # equivalente (ma più chiaro) var="~" # assegno ~ a $var printf %s\\n "$var" # stampo ~ printf %s\\n $var # equivalente (nessuna espansione) var=~root # assegno a var la home di root printf %s\\n ~ # stampo la home dell'utente printf %s\\n "$HOME" # equivalente printf %s\\n "~" # stampo ~ printf %s\\n ~root # stampo la home di root printf %s\\n ~fdsfd # stampo ~fdsfd (l'utente fdsfd non esiste)
Espansione di percorso
Le espansioni di percorso sono possibili solo se i caratteri speciali che la consentono (* ? [ ]
) non sono racchiusi tra virgolette, apici o preceduti da /
. È sempre consigliabile racchiudere tutto il resto tra virgolette, per non permettere espansioni accidentali.
L'espansione non è possibile, direttamente, in un'assegnazione. Avendo la priorità più bassa, contrariamente all'espansione di tilda può avvenire anche in seguito all'espansione di una variabile (e con ogni altra espansione), se non è quotata:
var="./*" # assegno ./* a $var var=./* # come sopra (nessuna espansione in un'assegnazione) printf %s\\n "$var" # stampa letteralmente ./* printf %s\\n $var # stampa la lista di tutti i file non nascosti # nella directory corrente, oppure ./* se è vuota
Sintassi (prefisso e suffisso possono essere omessi, o essere variabili da espandere):
prefisso?suffisso
sostituisce un singolo carattere di un nome di file, con tutti quelli possibili che combaciano con le due stringhe date, ma di default tranne il . iniziale se manca il prefisso;prefisso*suffisso
può sostituire tutti i caratteri nei nomi di file, ma di default tranne quelli nascosti se manca il prefisso (ossia quelli inizianti con .);prefisso[classe]suffisso
sostituisce un singolo carattere di un nome di file, con tutti quelli possibili appartenenti alla classe data e che combaciano con le due stringhe. La classe può contenere:- una lista di caratteri, tutti attaccati, per sostituirne uno qualsiasi della lista;
- un intervallo composto da due caratteri separati da un trattino
-
, per sostituirne uno qualsiasi dell'intervallo in base al loro valore ASCII; - un
!
iniziale per farne il complemento, ossia sostituirne uno qualsiasi non presente nella classe; - il carattere
!
può essere contenuto per il suo valore letterale in una classe purché non in prima posizione, mentre-
è considerato letteralmente soltanto in prima posizione (o seconda se dopo!
) e in ultima posizione.
Se un nome di file non include il percorso assoluto (iniziante con la directory radice /) o relativo (iniziante con ./ oppure ../, dalla directory corrente e da quella superiore rispettivamente), di default si assume che sia nella directory corrente. Tuttavia per evitare ambiguità con i nomi delle opzioni di alcuni comandi, in presenza di possibili nomi di file inizianti con il trattino -, in particolare se la parte iniziale del file è generata dall'espansione di percorso, è sempre bene rendere esplicito il percorso relativo premettendo ./ al nome del file.
Esempi (nella directory corrente):
./file.???
si espande a tutti i file con nome "file" e con una qualsiasi estensione di tre caratteri;./???.ext
si espande a tutti i file con nomi di tre caratteri (salvo i file nascosti, ossia con . iniziale) ed estensione ext;./*
si espande a tutti i file non nascosti nella directory corrente;./*.txt
espande a tutti i file con estensione .txt (NOTA: anche directory e qualsiasi file non regolare avente tale estensione);./*."${estensione}"
espande dopo aver espanso la variabile (contrariamente a ~), che può anche essere quotata;"./${nome}"*
espande a tutti i file inizianti con ${nome};./*/
espande a tutte le directory non nascoste;./.*
espande a tutti i file nascosti (ATTENZIONE: comprese "." e "..", ossia directory corrente e superiore);[a-zA-Z]*
espande a tutti i file inizianti con una lettera qualsiasi (nessun file nascosto perché il punto non è nella classe);./*.[tT][xX][tT]
espande a tutti i file con estensione txt (ignorando maiuscole e minuscole);./.[!.]*
espande a tutti i file nascosti di almeno due caratteri in cui il secondo non è un punto (non espande a . e .., ma nemmeno a possibili file nascosti inizianti con ..);./..?*
espande a tutti i file nascosti di almeno tre caratteri in cui il secondo non è un punto (tutti i file nascosti saltati dal precedente, ma sempre escludendo . e ..);./.[!.]* ./..?*
espande a tutti i file nascosti, esclusi . e .. (POSIX).
È importante sapere che, se nessun file combacia con un dato pattern, allora l'espansione non viene effettuata e i caratteri mantengono il loro valore letterale. E inoltre *
, ?
, [
e ]
sono caratteri validi per un nome di file.
L'esistenza di file ottenuti da tali espansioni va pertanto sempre controllata, impiegando l'espansione per generare una lista di stringhe all'interno di un ciclo for
, ed effettuando poi il controllo di esistenza su ognuna:
for file in ./*; do if [ -e "$file" ]; then ... fi done
Si faccia attenzione che tutti i pattern delle espansioni di percorso, e non solo quelli composti da *
, possono generare più stringhe, anche se sostituiscono un singolo carattere in presenza di fili multipli con lo stesso prefisso e/o suffisso (per esempio il pattern a?c può espandersi alla lista abc aBC acc, se esistono questi tre file).
In alternativa il comportamento di default dell'espansione può essere cambiato in bash (non POSIX), tramite shopt -s
:
- nullglob espande a "niente" se non trova nessun file con un dato pattern, rendendo superfluo il controllo sull'esistenza;
- dotglob espande ai file nascosti (ma non a . e ..);
- nocaseglob espande il percorso a tutte le corrispondenze trovate, ignorando maiuscole e minuscole (case-insensitive).
Per esempio per espandere a tutti i file, compresi quelli nascosti:
shopt -s dotglob nullglob for file in ./*; do ... done
Esempio: cambiare l'estensione ai file regolari
Rinomina tutti i file regolari *.txt
della directory corrente in *.log
, tramite il comando esterno mv
:
for f in ./*.txt; do if [ -f "$f" ]; then mv -- "$f" "${f%txt}log" fi done
Si noti che utilizzando [ -f ... ]
in luogo di [ -e ... ]
, si saltano anche tutti i file che non sono regolari, e che potrebbero essere restituiti dall'espansione di percorso.
Espansione di parentesi (graffa)
In bash (non POSIX) se i caratteri {
e }
non sono quotati, e non sono preceduti dal carattere di escape \
, possono essere espansi con due diverse sintassi per generare una lista di stringhe. E più espansioni di parentesi possono essere annidate.
Questa espansione avviene prima di tutte le altre, e il risultato può passare per tutte le altre espansioni. Non può avvenire in un'assegnazione, se non all'interno di altre espansioni.
Con indici di intervallo
Sintassi: prefisso{x..y[..z]}suffisso
L'espansione avviene per tutte le stringhe nell'intervallo compreso da "prefissoxsuffisso" fino a "prefissoysuffisso", con incrementi di 1 (o z se specificato). Le stringhe prefisso e suffisso possono essere omesse, o essere variabili (anche quotate, purché le graffe non lo siano), mentre x e y (e z, se presente) devono essere determinati valori e non possono essere variabili:
{x..y}
dove x e y sono due interi;{x..y..z}
dove x, y e z sono tre interi;{a..b}
dove a e b sono due caratteri;{a..b..z}
dove a e b sono due caratteri, e z è un intero.
Per esempio:
# crea un file temporaneo, associa il percorso a $tmp_file tmp_file=$(tempfile) # crea altri dieci file temporanei (.0, .1, .., .9) con lo stesso nome touch -- "$tmp_file".{0..9}
Con lista di stringhe
Sintassi: prefisso{stringa1,stringa2,...}suffisso
L'espansione avviene per tutte le stringhe nella lista, racchiudendole tra il prefisso e il suffisso dati, se presenti. Il prefisso, il suffisso e tutte le stringhe possono essere variabili, anche quotate, purché non siano quotate le graffe e le virgole interne.
Questa espansione è effettuata prima di tutte le altre, e il risultato dell'espansione se non quotato può quindi subire ulteriori espansioni. Per esempio per effettuare un'operazione sui file nella cartella corrente che hanno una data estensione, si può scrivere:
for file in ./*.{odt,abw,txt,rtf,doc}; do if [ -e "$file" ]; then ... fi done
e la prima riga è equivalente a:
for file in ./*.odt ./*.abw ./*.txt ./*.rtf ./*.doc; do
Istruzioni composte
Sono istruzioni composte tutte le istruzioni che possono contenere al loro interno altre istruzioni. Per esempio if
e for
, già trattate in precedenza per la loro importanza, sono due istruzioni composte.
Cicli
In aggiunta a for
, trattato per le assegnazioni e che può essere considerato equivalente al for each di alcuni linguaggi di programmazione, con while
è possibile eseguire un blocco di comandi se un comando ha successo e ripeterne l'esecuzione fintanto che il comando continua ad avere successo. Proprio come if
, while
è un'istruzione usata spesso in congiunzione con [...]
per ripetere un blocco di codice tutte le volte che la condizione espressa è vera.
Sintassi base (in congiunzione con [...]
):
while [ espressione-booleana ] do ... done
Per esempio:
num= # ripeti finché non è soddisfatta la condizione (si noti il ! davanti a [...]) while ! [ "$num" -gt 0 ] 2> /dev/null do printf %s "Inserisci intero > 0 e premi INVIO: " # assegna l'input dell'utente a $num read num done printf %s\\n "Hai inserito: ${num}"
Oppure al posto di [...]
si può utilizzare un comando qualsiasi, per esempio per eseguire un ciclo infinito:
while : do ... done
Un ciclo può essere sempre:
- interrotto da
break
; - ripreso dalla prima istruzione del blocco, dopo aver rivalutato l'exit status del comando dopo
while
, concontinue
.
Composizione di comandi con pipe
Una pipe collega due comandi, trattando l'output generato dal primo come input per il secondo, in modo da svolgere funzioni più complesse tramite la composizione comandi che si occupano di funzioni più limitate. Ed è una delle caratteristiche di UNIX che ogni comando debba svolgere un'unica funzione nel modo migliore possibile, permettendo la comunicazione con l'utente o un altro comando attraverso un flusso di testo, considerato un'interfaccia universale.
L'exit status di una serie di pipe è dato dall'ultimo comando.
Sintassi:
- comando1 | comando2: pipe che invia lo standard output del comando precedente al successivo. Tutti i comandi di una serie di pipe (anche l'ultimo) sono eseguiti in una subshell, e possono stare su righe diverse con la pipe come ultimo carattere;
- comando1 2>&1 | comando2: pipe che invia standard output e standard error (si veda la parte sui file descriptor) del comando precedente al successivo. Tutti i comandi di una serie di pipe (anche l'ultimo) sono eseguiti in una subshell, e possono stare su righe diverse con la pipe come ultimo carattere.
I più comuni comandi esterni impiegati con una pipe (per informazioni sulle loro opzioni si lascia alla lettura della loro pagina di manuale):
cat
per concatenare più file;head
etail
per leggere la parte iniziale e finale di un file;grep
per filtrare le righe di un file in base a un dato pattern;sed
per modificare le parti corrispondenti a un dato pattern con altre stringhe;cut
per selezionare dei campi da ogni riga, ma in base a un determinato carattere delimitatore (di default la tabulazione), conteggiato anche se ripetuto;awk
per selezionare dei campi da ogni riga, separandoli in base a spazi e tabulazioni (ignorando quelli consecutivi). Questa è la sua funzione base, maawk
è un vero e proprio linguaggio di programmazione, che se padroneggiato può sostituire le funzionalità di buona parte degli altri comandi;sort
euniq
per ordinare le righe in base a determinati campi e saltare quelle doppie;wc
per conteggiare il numero di caratteri, parole e/o linee;tr
per rimuovere o trasformare i caratteri di una data classe.
Per esempio:
# filtra le occorrenze di video nel ring buffer del kernel dmesg | grep -i video # -i per ignore-case (ignora maiuscole/minuscole) # stampa il gateway utilizzato ip route | # stampa la tabella di routing grep "^default" | # filtra solo la riga iniziante con default awk "{ print \$3 }" # stampa il terzo campo ($3 non dev'essere espanso dalla shell)
Output dei comandi e carattere ASCII n. 0
Una variabile non può contenere il carattere ASCII n. 0, che è usato per indicare la fine della stringa. Non potendo gestire direttamente il carattere ASCII n. 0, questo non può essere presente nell'espansione di un comando, ma dev'essere riservato ai soli comandi mediante l'uso di una o più pipe.
Infatti non esiste un modo di contenere il carattere ASCII n. 0 in nessuna posizione:
var=$'\000' # SBAGLIATO: $var è vuota var=$'X\000X' # SBAGLIATO: $var contiene X (solo la prima!) var=$(printf %s\000%s X X) # SBAGLIATO: $var contiene XX
Si noti che mentre è rimosso dalle espansioni, nelle assegnazioni normali viene interpretato come carattere di fine stringa, con il risultato che anche tutto ciò che segue viene tralasciato.
Nomi di file con caratteri non comuni
Questo carattere è utile perché nemmeno i file possono averlo nel proprio nome, mentre invece permettono caratteri jolly (*, ?, ...), come già visto con le espansioni di percorso, e potrebbero contenere perfino il carattere "a capo".
L'espansione di percorso funziona normalmente, anche in presenza di "a capo", ma potrebbero sorgere problemi sfruttando l'espansione di comando. Per esempio con il comando esterno find
, utilizzato per effettuare ricerche in modo ricorsivo, e che di default restituisce i file trovati stampandoli uno per riga, assumendo implicitamente che non contengano il carattere "a capo".
Uno script a titolo esemplificativo:
# creo una directory e un file con "a capo" nel nome mkdir ./prova touch ./prova/"file contenente"$'\n'"a capo nel nome" # SBAGLIATO! (per via del nome del file particolare) num_file=$(find ./prova -type f | # stampo i file regolari nella directory, uno per riga wc -l) # conto il numero di righe printf %s\\n "La directory prova contiene ${num_file} file" # restituisce 2 invece di 1 # forma corretta (ma non la più efficiente, è solo per esemplificare l'uso del carattere) num_file=$(find ./prova -type f -print0 | # stampo il carattere ASCII n. 0 dopo ogni file tr -dc '\000' | # rimuovo tutti i caratteri ASCII diversi dal n. 0 wc -c) # conto il numero di caratteri printf %s\\n "La directory prova contiene ${num_file} file" # restituisce 1 # pulizia rm -- ./prova/file*nome # elimino il file rmdir -- ./prova # elimino la directory (se vuota)
Comando find e carattere ASCII n. 0
Un abbinamento comune al comando esterno GNU find
(dotato dell'opzione -print0) è il comando esterno GNU xargs
(dotato dell'opzione -0):
find /percorso -opzione1 ... -opzioneN -print0 | # trova file che soddisfano le condizioni date xargs -0 comando [ argomenti ... ] # li passa come argomenti a un comando esterno
Si leggano i rispettivi manuali per maggiori informazioni. find
ha la possibilità di eseguire altri comandi esterni sui file trovati direttamente con le opzioni -exec ed -execdir, ma la sintassi è più complessa e non supporta più di un processo per volta, come invece xargs
.
Con bash (non POSIX) esiste un metodo per trattare indirettamente il carattere ASCII n. 0 anche con i comandi interni della shell, tramite l'istruzione read
e l'opzione per impostare il carattere come delimitatore, così da replicare la funzionalità di xargs -0
. In questo modo il carattere non verrà assegnato alle variabili, ma sarà usato all'interno di un ciclo per delimitare ogni valore dal successivo, permettendo la lettura dell'output generato da find
(con -print0
):
find /percorso -opzione1 ... -opzioneN -print0 | while read -d $'\000' file do # posso usare "$file" ... done
Si ricorda però che tutto il blocco while
, facendo parte di una pipe, è eseguito in una subshell. E che quindi tutte le variabili sono reimpostate al loro valore precedente al termine del blocco.
È invece sempre sbagliato, come soluzione generale se i nomi di file non seguono convenzioni note a priori, utilizzare l'espansione di comando con find
all'interno di un ciclo for
:
for file in $(find ...) # NO!
Concatenazione e blocchi di comandi
Più comandi, anche contenenti redirezioni, possono essere concatenati per formarne di più complessi. L'operatore di concatenazione può essere anche l'ultimo di una riga, per facilitare la leggibilità del codice.
;
- separatore di comandi, con cui un comando verrà eseguito a prescindere dal successo del precedente (in uno script è equivalente a un "a capo" e questa è la concatenazione di default)
&
- separatore che esegue il comando precedente in background (ritorna exit status sempre positivo e non riceve input da tastiera), passando al successivo
&&
- operatore logico AND, che va posizionato tra due comandi, il secondo dei quali è eseguito solo se il primo ha esito positivo
Esempio:
cd /percorso/dir && comando
Attenzione invece alla pericolosità di:
cd /tmp/tmpdir # cambia la cartella corrente in /tmp/tmpdir # ma se fallisce, quello successivo verrebbe eseguito comunque! rm -- ./* # cancella tutti i file nella directory corrente
||
- operatore logico OR, il secondo comando è eseguito solo se il primo ha effetto negativo (si può usare anche dopo una sequenza di &&, perché ha priorità inferiore):
{ ... ; }
- esegue un blocco di comandi (dopo l'ultimo servono ";" o un "a capo"). È usata nelle funzioni ed è utile per concatenare && e ||:
# interrompe la catena se un comando fallisce cd /tmp/tmpdir && rm -- ./* && rmdir -- /tmp/tmpdir || { # il blocco è eseguito solo se un comando fallisce retval=$? printf %s\\n "ERRORE (exit status: $retval)" >&2 exit $retval }
( ... )
- esegue il blocco di comandi in una subshell (le variabili vengono ripristinate al loro valore precedente, alla fine del blocco).
Catturare l'exit status
Per catturare lo stato d'uscita di un comando appena eseguito è sufficiente espandere la variabile speciale $?
, come già visto. Tuttavia in caso di fallimento del comando, il controllo effettuato via $?
avverrebbe soltanto dopo un blocco con errore (si veda la parte introduttiva sul debug).
Per evitare che un blocco abbia un exit status diverso da zero, si possono usare le concatenazioni &&
e ||
(oppure un if
):
comando && status=0 || # se corretto status=$? # se sbagliato
Funzioni
Una funzione è un raggruppamento di comandi eseguito ogni volta che il nome della funzione è utilizzato come un comando. Per convenzione le definizioni delle funzioni precedono il corpo principale dello script.
All'interno del blocco di comandi (il corpo della funzione), le variabili speciali relative agli argomenti passati allo script ($# $1 $2 ... $* $@
) fanno riferimento a quelli passati alla funzione.
Sintassi della definizione:
nomefunzione () { ... }
I comandi contenuti nel corpo della funzione sono eseguiti ogni volta che nomefunzione (una singola stringa senza spazi con le stesse limitazioni dei nomi delle variabili) è scritto come comando. Si noti che ()
dopo il nome della funzione serve a identificare l'istruzione composta come una definizione di funzione, e non accetta argomenti al suo interno come altri linguaggi di programmazione, ma resta sempre ()
invariata.
In bash è possibile premettere function
al nome della funzione, anche senza bisogno di ()
, ma questa possibilità non è prevista da POSIX.
Nel corpo di una funzione è possibile utilizzare il modificatore local
prima di un'assegnazione per rendere la variabile locale, ossia non accessibile fuori dal corpo della funzione. È bene evitare le variabili globali il più possibile (se non sono costanti), ricorrendo ai passaggi di parametri, per evitare la modifica accidentale di variabili esistenti fuori dalla funzione. Questo modificatore non è previsto da POSIX, dove ogni variabile è globale, ma è comunque supportato da ogni moderna shell compatibile.
Il valore di ritorno di una funzione è quello dell'ultimo blocco eseguito. In alternativa è possibile specificarlo all'interno dei blocchi direttamente con la parola riservata return
seguito dall'exit status (un valore qualsiasi tra 0, l'unico per "successo", e 255), facendo terminare la funzione immediatamente.
Se la funzione deve restituire un valore diverso da successo/insuccesso (o comunque per cui basterebbe l'exit status), è possibile:
- stamparlo come output, così che sia assegnabile a una variabile con l'espansione di comando, ma soltanto se non contiene caratteri non ammissibili (il carattere ASCII n. 0 e possibili "a capo" finali, che verrebbero rimossi). Si noti che questo metodo non è possibile in generale per i nomi di file, a meno che non seguano convenzioni note a priori;
- stamparlo come output seguito da un carattere qualsiasi (per esempio X), così che sia assegnabile a una variabile con l'espansione di comando, rimuovendo in seguito il carattere finale in più. Con questo metodo è possibile passare nomi di file qualsiasi, ma al solito non il carattere ASCII n. 0;
- utilizzare una variabile globale, eventualmente con il nome della funzione per evitare doppioni (per esempio: return_nomefunzione), contenente il valore da restituire nella funzione. Si noti che anche in questo caso il carattere ASCII n. 0 non può essere assegnato.
File descriptor
Su UNIX e Unix-like ogni processo che non è avviato in background ha di default tre file descriptor, nella forma di identificativi interi:
- 0 (stdin), lo standard input, da cui si leggono gli input (di default quanto scritto dalla tastiera sul terminale associato);
- 1 (stdout), lo standard output, a cui si inviano tutti i messaggi prodotti (di default sul terminale associato);
- 2 (stderr), lo standard error, a cui si inviano tutti i messaggi di errore prodotti (di default sul terminale associato).
Lo standard input è chiuso per i processi avviati in background.
Si chiamano file descriptor perché sono identificativi che fanno riferimento a un file; e infatti perfino i dispositivi, anche virtuali come il terminale, sono considerati dei file. Questo permette la possibilità di associare in modo trasparente questi file descriptor standard anche a file qualsiasi, oltre che ad altri file descriptor, in modo da ridirigerne il contenuto. E disporre di due diversi file descriptor per l'output prodotto da un comando e i messaggi di errore, permette di disabilitare anche solo uno dei due, o di salvarli su due file diversi.
Redirezioni
Alcune comuni redirezioni, da scriversi dopo un comando (la stringa file può essere anche una variabile quotata):
- < file collega lo standard input al file, in modo da leggerne il contenuto. Il file descriptor è implicito, ma sarebbe equivalente scrivere 0< file;
- > file dopo un comando ne scrive lo standard output sul file (troncandolo, se esiste). Si noti che il file descriptor è implicito, ma sarebbe equivalente scrivere 1> file;
- >> file (append) aggiunge il contenuto dello standard output al file (creandolo, se non esiste). Il file descriptor è implicito, ma sarebbe equivalente scrivere 1>> file;
- 2> file è equivalente a > file, ma qui si specifica di ridirigere lo standard error anziché lo standard output sul file (con append: 2>> file);
- >&2 scrive lo standard output sullo standard error. Il file descriptor dello standard output è implicito, mentre quello alla destra dev'essere preceduto da
&
, ma sarebbe equivalente scrivere 1>&2; - 2>&1 scrive lo standard error sullo standard output;
- &> file (non POSIX, abbreviazione per: > file 2>&1) invia standard output ed error sul file (con append: &>> file);
- <&- chiude lo standard input. Il file descriptor è implicito, ma sarebbe equivalente scrivere 0<&-;
- >&- chiude lo standard output. Il file descriptor è implicito, ma sarebbe equivalente scrivere 1>&-;
- 2>&- chiude lo standard error.
Per evitare la scrittura a schermo standard output e/o standard error non vanno chiusi, oppure l'operazione genererebbe un errore (perché il file descriptor relativo non esisterebbe più), ma ridiretti su /dev/null
, un file dispositivo la cui esistenza è specificata da POSIX che non produce mai output e può essere usato per assorbire qualsiasi cosa.
Esempi:
comando &> /dev/null # non stampa niente a schermo, neanche gli errori comando > /dev/null 2>&1 # equivalente (POSIX) # si noti la differenza con: comando >&- 2>&- # standard output ed error sono chiusi, quindi se # venissero usati, l'exit status sarebbe diverso da 0!
Una pipe (comando1 | comando2
), già trattata nella sezione sulle istruzioni composte, è anch'essa una forma di redirezione, in cui lo standard output di comando1 diventa lo standard input di comando2.
Scope della redirezione
Si noti che lo scope (il raggio d'azione) della redirezione non serve soltanto per evitare di scrivere più volte il percorso del file, ma ne influenza anche il significato. In particolare con la redirezione dello standard input (lettura), per garantire che tutte le istruzioni continuino la lettura da dove era rimasta invece che riprenderla sempre dall'inizio, e dello standard output, per garantire che il file non venga troncato da ogni comando ma che i successivi continuino a scrivere in seguito (come se usassero la redirezione con append).
Per esempio in genere è sbagliato scrivere:
while read riga < file do # "$riga" contiene *SEMPRE* la prima riga del file # quindi il ciclo può essere eseguito per sempre se ha più di una riga! done
Mentre quello che si vuole è probabilmente:
while read riga do # "$riga" contiene sempre una nuova linea del file # il ciclo è eseguito per ogni linea del file done < file
Si noti che leggere in questo modo un file ha senso solo per file non binari, che potrebbero contenere anche il carattere ASCII n. 0, che non può essere memorizzato in una variabile. Inoltre l'istruzione read
fallisce se non trova un "a capo", per cui l'ultima riga del file è letta all'interno del ciclo soltanto se termina con un "a capo", altrimenti è necessario controllare se è vuota la variabile dopo il ciclo.
Nuovi file descriptor
In aggiunta ai tre file descriptor standard, è possibile aprirne di nuovi, in lettura (FD<...
...), in scrittura (FD>...
, append: FD>>...
) e in lettura/scrittura (FD<>...
), dove FD è un intero rappresentante il nuovo file descriptor e al posto dei puntini può esserci sia un file sia un file descriptor già esistente preceduto dal carattere &
.
È necessario quindi determinare a quale file (o file descriptor, se preceduto da &
) il nuovo file descriptor va associato. Ci sono due modi:
- specificarlo dopo un'istruzione composta, in modo che il file descriptor sia utilizzabile normalmente all'interno;
- specificarlo con l'istruzione
exec
senza altri argomenti (o avrebbe un significato diverso).
Per usarlo invece, una volta aperto, il file descriptor va scritto subito dopo la redirezione, preceduto dal carattere &
.
Per esempio:
{ # il file descriptor 3 è definito dentro il blocco (in scrittura) comando1 >&3 # ridirige lo standard output sul nuovo file descriptor comando2 comando3 >&3 # come per comando1 } 3> file # apre in scrittura il file descriptor per il contenuto del blocco # NOTA: fuori dal blocco il nuovo file descriptor non esiste più
Sul file scelto sono ridiretti lo standard output di comando1 e comando3. È equivalente a:
comando1 > file # scrittura
comando2
comando3 >> file # scrittura con append! (nel blocco è implicito)
Equivalentemente, con exec
:
exec 3> file # apre il file descriptor in scrittura comando1 >&3 # usa il file descriptor comando2 comando3 >&3 # usa il file descriptor exec 3>&- # chiude il file descriptor
Finché un file descriptor non è chiuso, non è garantita la scrittura sul file, ma la scrittura tramite file descriptor è più efficiente.
Salvare i file descriptor
Si noti che exec
è equivalente a una redirezione in un blocco, ma la chiusura dei file descriptor aperti dev'essere gestita manualmente. Prima di cambiare quelli standard, per consentirne il successivo ripristino al loro valore originale, vanno salvati in un nuovo file descriptor temporaneo:
exec 3<&0 # apre un nuovo file descriptor per salvare lo standard input exec < file # sovrascrive lo standard input read riga # legge la prima riga (se esiste) read riga # legge la seconda riga (se esiste)! (e non di nuovo la prima) exec <&3 # assegna nuovamente lo standard input al suo valore precedente exec 3<&- # chiude il nuovo file descriptor
si ricordi che invece, senza exec e senza un blocco, una redirezione (di lettura o scrittura senza append) su un singolo comando parte sempre dall'inizio:
read riga < file # legge la prima riga del file (se esiste) read riga < file # legge sempre la prima riga del file (se esiste)!
Segnali
Ogni processo in UNIX e Unix-like può ricevere dei segnali da altri processi (se appartengono allo stesso utente oppure da root). Di seguito i principali, tra quelli previsti da POSIX:
- INT : è equivalente a
Ctrl-c
da tastiera, per uno script associato a un terminale (non eseguito in background). L'azione di default è la terminazione; - QUIT : è equivalente a
Ctrl-\
da tastiera, per uno script associato a un terminale (non eseguito in background). L'azione di default è la terminazione con core dump; - HUP : è equivalente a chiudere il terminale, per uno script associato a un terminale (anche se eseguito in background), o in generale alla morte di un processo padre. L'azione di default è la terminazione;
- TERM : è il segnale di terminazione di default. L'azione di default è la terminazione;
- KILL : è un segnale di terminazione che non può essere ignorato (si veda trap). L'unica azione che sarà eseguita è la sua terminazione immediata;
- PIPE : è equivalente al segnale ricevuto da un processo che invia l'output a una pipe, quando il processo lettore ha terminato. L'azione di default è la terminazione;
- ABRT : è il segnale di abort. L'azione di default è la terminazione con core dump;
- STOP : è equivalente a
Ctrl-z
da tastiera, per uno script associato a un terminale (non eseguito in background), ma come KILL non può mai essere ignorato (si veda trap). L'unica azione che sarà eseguita è la sua interruzione immediata; - CONT : è il segnale per continuare l'esecuzione per un processo interrotto. Se il processo non è interrotto, di default il segnale è ignorato;
- TSTP : è equivalente a Bloc Scor (o
Ctrl-s
; per riprendere:Ctrl-q
), per bloccare l'output. L'azione di default è interrompere il processo; - CHLD : è il segnale che un processo figlio è terminato (viene inviato automaticamente). Di default è ignorato;
- WINCH : è il segnale che la finestra del terminale è stata ridimensionata. Di default è ignorato;
- USR1 : è un segnale lasciato da definire all'utente. L'azione di default è la terminazione;
- USR2 : è un segnale lasciato da definire all'utente. L'azione di default è la terminazione.
Il core dump è un dump dello stato (o una sua parte) del processo terminato, a scopo di debug. Può essere limitato e anche disattivato interamente. Se non attivo, l'azione eseguita è equivalente a una terminazione senza core dump.
Invio e cattura di segnali
Alcuni segnali vengono inviati automaticamente, al sussistere di determinate condizioni, ma possono anche essere inviati esplicitamente con il comando kill
.
Sintassi: kill [ -s SIGNAL ] pid
Invia un segnale (di default: TERM) al processo con il pid scelto. Si noti che l'invio è asincrono, ossia kill
non resta in attesa che il processo con pid scelto effettui l'azione associata al segnale. Di conseguenza il comando ha sempre successo, salvo che il pid non esista o non possa ricevere il segnale (per esempio perché non è dello stesso utente).
Le azioni da intraprendere possono essere modificati con l'istruzione trap
.
Sintassi: trap 'stringa' SIGNAL1 [ ... ]
Cattura i segnali (se possibile, non lo è per KILL e STOP), con il seguente comportamento:
- se la stringa è il solo carattere
-
, le azioni associate alla lista di segnali sono impostate nuovamente come quelle di default per i segnali; - se la stringa è vuota, i segnali verranno ignorati;
- se la stringa è il nome di una funzione, verrà eseguita ogni volta che uno dei segnali viene ricevuto. L'azione normale è sovrascritta, quindi se è necessario preservarla dopo la funzione, dovrà occuparsene la funzione stessa (per esempio di uscire con
exit
dopo aver effettuato la pulizia); - il segnale può essere EXIT, che ha significato solo per questa istruzione, in tal caso la funzione sarà eseguita alla fine dello script, che può essere causata anche da segnali (con l'unica eccezione di KILL), purché lo script non termini con un
exec
seguito da un eseguibile.
Un esempio classico di trap
:
clean () { # funzione di pulizia ... } trap 'clean' EXIT # la funzione clean è eseguita se si riceve un segnale di terminazione ... if comando; then exec eseguibile # clean NON è eseguita dopo exec e un eseguibile fi ... exit 0 # clean è eseguita anche con exit
In caso di esecuzione di una subshell le azioni da intraprendere in seguito alla ricezione di un segnale vengono reimpostate al loro valore di default, ma i segnali ignorati continuano a restare ignorati.
Link
- Bash Referece Manual: manuale ufficiale
- Advanced Bash-Scripting Guide: la Bibbia dello bash scripting.
Guida scritta da: ~ The_Noise (in Bash tips) | Debianized 60% |
Estesa da: | |
Verificata da: | |
Verificare ed estendere la guida | Cos'è una guida Debianized |