L'arte della programmazione in C

sabato 9 luglio 2016

UDPhunter
come scrivere un UDP Server in C - pt.1

Spesso si può fare la stessa cosa in due (o magari 1000...) maniere differenti. Non necessariamente buone tutte. Ad esempio da un buon romanzo come Red Dragon sono stati tratti due film: uno è un capolavoro di Michael Mann, mentre l'altro è una vera schifezza che sarebbe stato meglio non girare.

Mr UDP, Mr TCP e la fotografia abbagliante di un capolavoro

Quando pensiamo alle comunicazioni basate sui Socket pensiamo sempre ai TCP Client/Server, e ci dimentichiamo dell'esistenza di UDP. Ecco, con UDP si possono fare cose eccellenti, sempre considerando quello che dice il manuale:

...It implements a connectionless, unreliable datagram packet
service.  Packets may be reordered or duplicated before they arrive.
UDP generates and checks checksums to catch transmission errors...

Non facciamoci tradire dalla (preoccupante) parola unreliable: se lo usiamo nelle applicazioni giuste (quelle dove la perdita/duplicazione di un pacchetto non è un errore tragico... il VoIP, per esempio) le doti di UDP (velocità, leggerezza, facilità di implementazione) vengono fuori alla grande.

Per cui vi propongo un UDP Server che è quasi una copia del TCP server visto qui, e che già a prima vista si nota più semplice. Vai col codice!

#include <stdio.h>
#include <stdlib.h>
#include <string.h>
#include <arpa/inet.h>
#include <errno.h>

#define MYBUFSIZE 1024

int main(int argc, char *argv[])
{
    // test argomenti
    if (argc != 2) {
        // errore args
        printf("%s: numero argomenti errato\n", argv[0]);
        printf("uso: %s port [i.e.: %s 8888]\n", argv[0], argv[0]);
        return EXIT_FAILURE;
    }

    // crea un socket
    int my_socket;
    if ((my_socket = socket(AF_INET, SOCK_DGRAM, IPPROTO_UDP)) < 0) {
        // errore socket()
        printf("%s: non posso creare il socket (%s)\n", argv[0], strerror(errno));
        return EXIT_FAILURE;
    }

    // prepara la struttura sockaddr_in per questo server
    struct sockaddr_in server;              // (local) server socket info
    memset(&server, 0, sizeof(server));
    server.sin_family = AF_INET;            // set address family
    server.sin_addr.s_addr = INADDR_ANY;    // set server address for any interface
    server.sin_port = htons(atoi(argv[1])); // set server port number

    // bind informazioni del server al socket
    if (bind(my_socket, (struct sockaddr *)&server, sizeof(server)) < 0) {
        // errore bind()
        printf("%s: errore bind (%s)", argv[0], strerror(errno));
        return EXIT_FAILURE;
    }

    // loop di ricezione messaggi dal client
    struct sockaddr_in client;  // appoggio per dati del client per poter rispondere
    socklen_t socksize = sizeof(struct sockaddr_in);
    char client_msg[MYBUFSIZE];
    while (recvfrom(my_socket, client_msg, MYBUFSIZE, 0, (struct sockaddr *)&client, &socksize) > 0) {
        // send messaggio di ritorno al client
        printf("%s: ricevuto messaggio dal sock %d: %s\n", argv[0], my_socket, client_msg);
        char server_msg[MYBUFSIZE];
        sprintf(server_msg, "mi hai scritto: %s", client_msg);
        if (sendto(my_socket, server_msg, strlen(server_msg), 0, (struct sockaddr *)&client, sizeof(client)) < 0) {
            // errore send()
            printf("%s: errore send (%s)\n", argv[0], strerror(errno));
            return EXIT_FAILURE;
        }

        // clear buffer
        memset(client_msg, 0, MYBUFSIZE);
    }

    // errore recv(): il "client disconnected" con recv_size==0 non esiste perché questo server è connectionless
    printf("%s: errore recv (%s)\n", argv[0], strerror(errno));
    return EXIT_FAILURE;
}

Ok, come vedete è ampiamente commentato e quindi è auto-esplicativo, per cui non mi dilungherò sulle singole istruzioni e/o gruppi di istruzioni (leggete i commenti! sono li per quello!), ma aggiungerò, solo, qualche dettaglio strutturale.

La struttura è quella classica e basica di un UDP Server:

socket() - crea un socket
prepara la struttura sockaddr_in per questo server
bind() - bind informazioni del server al socket
recvfrom() - loop di ricezione messaggi dal client

In quest'esempio, che ho scritto e testato appositamente per il blog, nel loop di lettura c'è il re-invio al Client del messaggio ricevuto. Nel prossimo post vedremo il Client, così chiuderemo il cerchio e potremo testare sul serio una conversazione UDP Client/Server.

Come (spero) avrete notato, invece delle funzioni send/recv si usano sendto/recvfrom (che sono identiche alle controparti TCP ma aggiungono i dati dei sender/receiver) e, inoltre, mancano le fasi di listen e accept, il che rende il Server più semplice da scrivere e anche da usare: si possono fare sequenze di start/stop/restart di Server e Client nell'ordine che si vuole e la comunicazione, magicamente, si restaurerà sempre, mentre la versione TCP (immagino l'abbiate testata, e se no: correte a farlo!) che ha una fase di connessione, necessita di una più rigorosa sequenza di start/stop per funzionare.

Ci rivediamo per il UDP Client e, come sempre, non trattenete il respiro nell'attesa...

Ciao e al prossimo post!

venerdì 3 giugno 2016

Sprintf Driver
perché non bisogna usare la sprintf in C

"Ma dici a me? Ma dici a me?... Ma dici a me?...". Si, proprio come il grande De Niro in Taxi Driver, questa è stata la mia reazione (incredula) quando ho scoperto (molti anni fa, oramai) che, dopo anni e anni di onorato uso, avrei dovuto smettere di usare la sprintf().

...e tu dici a me di non usare più la sprintf? A me?...

Beh, in effetti se la usi bene e hai il 100% di controllo sul codice scritto puoi anche usarla senza grossi problemi ma, come dicono gli inglesi, la sprintf() è error prone, induce facilmente a errori, anche gravi. Il problema più grave ed evidente con la sprintf() si chiama buffer overflow, e non credo che sia necessario spenderci molte parole: se il buffer che passiamo come primo argomento non è correttamente dimensionato il disastro è dietro l'angolo.

Fortunatamente ci viene in aiuto la snprintf(), che è della stessa famiglia ma molto più sicura. Vediamo i due prototipi a confronto:

int sprintf(char *str, const char *format, ...);
int snprintf(char *str, size_t size, const char *format, ...);

La snprintf() ci obbliga a mettere il size del buffer come secondo argomento, per cui è facilissimo prendere l'abitudine a scrivere in un modo error-free come questo:

char buffer[32];
snprintf(buffer, sizeof(buffer), "Hello world!");

Se al posto di "Hello world!" avessimo scritto una stringa di più di 32 chars, nessun problema: la snprintf() la tronca opportunamente e siamo salvi.

E adesso vi propongo un piccolo esempio reale: prendiamo una nostra vecchia conoscenza scritta per un vecchio post, la getDateUsec() e la scriviamo in due versioni, una buona e una cattiva (bad). Vediamo:

#include <stdio.h>
#include <stdlib.h>
#include <sys/time.h>
#include <time.h>

// prototipi locali
char *getDateUsec(char *dest, size_t size);
char *badGetDateUsec(char *dest);

// funzione main
int main(int argc, char* argv[])
{
    // chiama getDateUsec (o badGetDateUsec) e scrive il risultato
    char dest[12];
    printf("date con usec: %s\n", getDateUsec(dest, sizeof(dest)));
    //printf("date con usec: %s\n", badGetDateUsec(dest));

    return EXIT_SUCCESS;
}

// getDateUsec() - Genera una stringa con data e ora (usa i microsecondi)
char *getDateUsec(char *dest, size_t size)
{
    // get time (con gettimeofday()+localtime() invece di time()+localtime() per ottenere i usec)
    struct timeval tv;
    gettimeofday(&tv, NULL);
    struct tm *tmp = localtime(&tv.tv_sec);

    // format stringa destinazione dest(deve essere allocata dal chiamante) e aggiunge i usec
    char fmt[128];
    strftime(fmt, sizeof(fmt), "%Y-%m-%d %H:%M:%S.%%06u", tmp);
    snprintf(dest, size, fmt, tv.tv_usec);

    // return stringa destinazione dest
    return dest;
}

// badGetDateUsec() - Genera una stringa con data e ora (usa i microsecondi) (versione bad)
char *badGetDateUsec(char *dest)
{
    // get time (con gettimeofday()+localtime() invece di time()+localtime() per ottenere i usec)
    struct timeval tv;
    gettimeofday(&tv, NULL);
    struct tm *tmp = localtime(&tv.tv_sec);

    // format stringa destinazione dest(deve essere allocata dal chiamante) e aggiunge i usec
    char fmt[128];
    strftime(fmt, sizeof(fmt), "%Y-%m-%d %H:%M:%S.%%06u", tmp);
    sprintf(dest, fmt, tv.tv_usec);

    // return stringa destinazione dest
    return dest;
}

Ecco, a suo tempo, per semplificare, avevo scritto una getDateUsec() che era, in realtà, una badGetDateUsec() (e in seguito, per precisione, ho provveduto a modificarla anche sul post). Quella versione funzionava ma poteva creare problemi, mentre la nuova versione è molto più sicura. Provate a compilare l'esempio, dove, volutamente, ho sottodimensionato il buffer di destinazione: commentando la badGetDateUsec() e usando la getDateUsec(), funziona perfettamente, troncando l'output a 12 chars. Se, invece, commentate la getDateUsec() e usate la badGetDateUsec() il programma si schianta durante l'esecuzione. Provare per credere!

E già che siamo in argomento sprintf() un piccolo consiglio un po' OT: se dovete aggiungere sequenzialmente delle stringhe (in un loop, ad esempio) su una stringa base (per comporre un testo, ad esempio) non fate mai cosi:

char buf[256] = "";
for (int i = 0; i < 5; i++)
    sprintf(buf, "%s aggiunto alla stringa %d\n", buf, i);

il metodo qui sopra sembra funzionare, ma, in realtà, funziona quando c'ha voglia lui. Fate invece così:

char buf[256] = "";
for (int i = 0; i < 5; i++) {
    char tmpbuf[256];
    sprintf(tmpbuf, "%s aggiunto alla stringa %d\n", buf, i);
    sprintf(buf, "%s", tmpbuf);
}

E se non ci credete provate a passare il codice con un lint tipo cppchek (che è sempre una buona idea) o consultate il manuale della sprintf():

C99 and POSIX.1-2001 specify that the results are undefined if  a  call
to  sprintf(), snprintf(), vsprintf(), or vsnprintf() would cause copy‐
ing to take place between objects that overlap  (e.g.,  if  the  target
string  array and one of the supplied input arguments refer to the same
buffer).

E, ovviamente, anche in quest'ultimo esempio (fatto per semplicità con la sprintf()) sarebbe raccomandabile usare la snprintf().

Ciao e al prossimo post!

sabato 7 maggio 2016

Strerror Simple
come scrivere una pseudo-strerror in C

Questo è un post facile. Magari un po' più del Blood dell'esordio dei grandi Coen brothers (uhm... il sangue non è mai facile). Si, un post facile facile, ma più utile di quel che sembra, tanto per dimostrare che a problema semplice soluzione semplice: se per fare una scemata avete scritto 1000000 di incomprensibili righe di codice avete sbagliato qualcosa: meglio cancellare e ricominciare, sicuramente vi verrà meglio.

...e questo tu lo chiami semplice? SEMPLICE???

Allora, supponiamo di avere dei codici che rappresentano qualcosa (errori, tipi di messaggi, warning di sistema, ciabatte, formaggi... qualsiasi cosa), e volete, per esempio, mostrarli in un bel sistema di log (magari come quello visto qui, qui e qui), ma non come numeri (ehi, siamo esseri umani, mica Sheldon Cooper): siamo abituati a visualizzare cose, non numeri. Vogliamo vedere le stringhe mnemoniche corrispondenti ai numeri.

...e da oggi vi parlerò usando solo codice binario...

Ecco, scrivere il codice per una cosa del genere è veramente molto semplice... vai col codice!

#include<stdio.h>

// codici stringhe
#define CODE_SPIDERMAN  0
#define CODE_THOR       1
#define CODE_DAREDEVIL  2
#define CODE_PUNISHER   3

// array stringhe
static const char* const strings[] = {
    "Spiderman",
    "Thor",
    "Daredevil",
    "Punisher"
};

// ottieni una stringa
const char* getString(
    int code)
{
    // calcola size
    int size = sizeof(strings) / sizeof(char*);

    // test se il codice va in overflow
    if (code >= 0 && code < size)
        return(strings[code]);
    else
        return("errore: codice non valido");
}

// main() per test
void main()
{
    // loop di input
    for (;;) {
        // chiede il codice
        int code;
        printf("get stringa numero? ");
        scanf("%d", &code);

        // mostra la stringa corrispondente al codice
        printf("stringa = %s\n", getString(code));
    }
}

Allora, tanto per non ripetermi: il codice qui sopra è, evidentemente, auto-esplicativo, ampiamente commentato e con commenti che parlano da soli.

Come avrete notato è sufficiente (almeno in una implementazione base) definire i codici e scrivere le stringe corrispondenti (nello stesso ordine!) in un array. Poi si scrive la funzione per estrarle che esegue, semplicemente, un return di array[codice]. Ho aggiunto un minimo (indispensabile) di controlli, per evitare l'uso di codici negativi o non esistenti (overflow). Notare che il size è calcolato dinamicamente, quindi possiamo aggiungere, col tempo, codici (e stringhe) senza bisogno di modificare la getString() (molto bene!). Ovviamente il codice presentato (che include anche un semplice main() di test interattivo) si può complicare e sofisticare quanto si vuole, ma rispettando l'idea base, che è semplice.

In un progetto reale il file qui sopra bisogna spezzarlo in tre: i codici (e un prototipo) andranno in un header-file che verrà incluso da tutti i source-file della applicazione che necessitano usare la getString(). La getString() e l'array (statico) di stringhe andranno in un source-file apposito (che chiameremo getstring.c) che verrà compilato e linkato insieme agli altri file del progetto.

Perché nel titolo ho citato la strerror()? Perché la nostra getString() fa, più o meno, lo stesso lavoro della strerror() di sistema, ossia restituisce la stringa corrispondente al codice di errore errno. Ovviamente la strerror() è un po' piu sofisticata: usa un buffer statico interno su cui esegue strcpy() e altre cosette... tra l'altro proprio per colpa del buffer interno non è thread safe, e, in alcuni casi ci costringe a usare la strerror_r(): ma questa è un altra storia, e questo è un post semplice, non divaghiamo.

Certo, se poi qualcuno di mestiere fa il complicatore di cose facili (che, sfortunatamente, è un lavoro abbastanza diffuso) tutto quello detto finora gli risulterà indifferente, magari addirittura fastidioso. Ma magari non dovrebbe leggere questo blog, sarà capitato qui per sbaglio.

Ciao e al prossimo post!

sabato 9 luglio 2016

UDPhunter come scrivere un UDP Server in C - pt.1

venerdì 3 giugno 2016

Sprintf Driver perché non bisogna usare la sprintf in C

sabato 7 maggio 2016

Strerror Simple come scrivere una pseudo-strerror in C

UDPhunter
come scrivere un UDP Server in C - pt.1

Sprintf Driver
perché non bisogna usare la sprintf in C

Strerror Simple
come scrivere una pseudo-strerror in C