1 Introdução à programação

It has often been said that a person does not really understand

something until after teaching it to someone else. Actually, a person

does not really understand something until after teaching it to

a computer (...)

Donald E. Knuth, Selected Papers in Computer Science, 10 (1996)

1.1 Computadores

O que é um computador? As respostas que surgem com mais frequência são que um computador é um conjunto de circuitos integrados, uma ferramenta ou uma máquina programável. Todas estas respostas são verdadeiras, até certo ponto. No entanto, um rádio também é um conjunto de circuitos integrados, um martelo uma ferramenta, e uma máquina de lavar roupa uma máquina programável... Algo mais terá de se usar para distinguir um computador dum rádio, dum martelo, ou duma máquina de lavar roupa. A distinção principal está em que o computador, ao contrário da máquina de lavar roupa, em que existe um conjunto muito pequeno de possíveis programas pré-definidos, é programável pelo seu utilizador, e não tem nenhuma aplicação específica: é uma máquina genérica. Claro que um computador usado para meras tarefas de secretariado (que têm os famosos "conecimentos de informática do ponto de vista do utilizador") não é muito diferente duma máquina de lavar roupa ou duma máquina de escrever.

Um computador é portanto uma máquina programável de aplicação genérica. Serve para resolver problemas de muitos tipos diferentes, desde o problema de secretaria mais simples, passando pelo apoio à gestão de empresas, até ao controlo de autómatos e à concretização de sistemas inteligentes. O objectivo desta cadeira é ensinar os princípios da resolução de problemas através dum computador.

Os computadores têm uma arquitectura que, nos seus traços gerais, não parece muito complicada. No essencial, os computadores consistem num processador (o "cérebro") que, para além de dispor de um conjunto de registos ("memória de curta duração"), tem acesso a uma memória ("memória de média duração") e a um conjunto de dispositivos de entrada e saída de dados, entre os quais tipicamente discos rígidos ("memória de longa duração"), um teclado e um ecrã. Esta é uma descrição simplista dum computador. Na cadeira de Arquitectura de Computadores estes assuntos serão estudados com mais profundidade. Na cadeira de Sistemas Operativos estudar-se-ão os programas que normalmente equipam os computadores de modo a simplificar a vida ao seu utilizador.

1.2 Programação

Como se programa um computador? Os computadores, como se verá na cadeira de arquitectura de computadores, entendem uma linguagem própria, usualmente conhecida por "linguagem máquina". Esta linguagem caracteriza-se por não ter qualquer tipo de ambiguidades: a interpretação das instruções é única. Por outro lado, esta linguagem também se caracteriza por consistir um conjunto de comandos ou instruções que são executados "cegamente" pelo computador: é uma linguagem imperativa. Os vários tipos de linguagens, imperativas, declarativas, etc., as várias formas de classificar as linguagens e as vantagens e desvantagens de cada linguagem serão estudados na cadeira de Linguagens de Programação.

A linguagem máquina caracteriza-se também por ser penosa para um humano: todas as instruções correspondem a códigos numéricos, difíceis de memorizar, e as instruções são muito elementares. Uma solução parcial passa por atribuir a cada instrução uma dada mnemónica. Às linguagens assim definidas chama-se linguagens assembly e aos tradutores de assembly para linguagem máquina assemblers ou assembladores. Soluções mais sofisticadas passam por equipar os computadores com compiladores, isto é com programas que são capazes de traduzir para linguagem máquina programas escritos em linguagens menos penosas para o programador e mais poderosas que o assembly. Infelizmente, não existem ainda compiladores para as linguagens naturais, que é o nome que se dá às linguagens humanas (e.g., português, inglês, etc.). Mas existem as chamadas linguagens de programação de alto nível (alto nível entre as linguagens de programação, bem entendido), que nos simplificam muito a vida como programadores. Nesta cadeira usar-se-á o C++ como linguagem de programação *.

Tal como o conhecimento profundo do português não chega para fazer um bom escritor, o conhecimento profundo duma linguagem de programação não chega para fazer um bom programador. O conhecimento da linguagem é necessário, mas não é de todo suficiente. Programar não é o simples acto de escrever ideias de outrem: é ter essas ideias, é ser criativo. Resolver problemas exige conhecimentos da linguagem, conhecimento das técnicas conhecidas de ataque aos problemas, inteligência para fazer analogias com outros problemas, mesmo em áreas totalmente desconexas, criatividade, intuição, persistência, etc. Programar não é um acto mecânico. Assim, aprender a programar consegue-se através do estudo e, fundamentalmente, do treino.

* Pode-se pensar num computador equipado com um compilador duma dada linguagem de programação como um novo computador, mais poderoso. É de toda a conveniência usar este tipo de abstração, que de resto será muito útil para perceber sistemas operativos, onde se vão acrescentando camada após camada de software para acrescentar "inteligência" aos computadores.

1.3 Algoritmos: resolvendo problemas

Dado um problema que é necessário resolver, como desenvolver uma solução? Como expressá-la? À última pergunta responde-se muito facilmente: usando uma linguagem. A primeira é mais difícil. Se a solução desenvolvida corresponder a um conjunto de instruções bem definidas e sem qualquer ambiguidade, podemos dizer que temos um algoritmo que resolve um problema, i.e., que a partir dum conjunto de dados produz determinados resultados. A noção de algoritmo não é simples de perceber, pois é uma abstração. Algoritmos são métodos de resolver problemas. Mas à concretização dum algoritmo numa dada linguagem já não se chama algoritmo: chama-se programa. Sob esse ponto de vista, todas as versões escritas dum algoritmo são programas, mesmo que expressos numa linguagem natural, desde que não façam uso da sua característica ambiguidade. Abusando um pouco das definições, no entanto, chamaremos algoritmo a um método de resolução de um dado problema expresso em linguagem natural, e programa à concretização de um algoritmo numa dada linguagem de programação.

Mas a definição de algoritmo é um pouco mais completa. De acordo com Knuth [1] os algoritmos têm cinco características importantes:

Finitude - Um algoritmo tem de terminar sempre ao fim de um número finito de passos. De nada nos serve um algoritmo se existirem casos em que não termina.
Definitude* - Cada passo do algoritmo tem de ser definido com precisão; as acções a executar têm de ser especificadas rigorosamente e sem ambiguidade. No fundo isto significa que um algoritmo tem de ser tão bem especificado que até um computador possa seguir as suas instruções.
Entrada - Um algoritmo pode ter zero ou mais entradas, i.e., entidades que lhe são dadas inicialmente, antes do algoritmo começar. Essas entidades pertencem a um conjunto bem definido (e.g., o conjunto dos números inteiros). Note-se que existem algoritmos interessantes que não têm qualquer entrada, embora sejam raros.
Saída - Um algoritmo tem uma ou mais saídas, i.e., entidades que têm uma relação bem definida com as entradas (o problema resolvido pelo algoritmo é o de calcular essas saídas).
Eficácia - Todas as operações executadas no algoritmo têm de ser suficientemente básicas para, em princípio, poderem ser feitas com exactidão e em tempo finito por uma pessoa usando um papel e um lápis.

* Definitude: qualidade daquilo que é definido.

Para além destas características dos algoritmos, pode-se também falar da sua eficiência, isto é, do tempo que demoram a ser executados para dadas entradas. Em geral, portanto, pretende-se que os algoritmos sejam não só finitos mas também "muito finitos" [1]. Significa isto que normalmente, e para a pior combinação possível das entradas, devem resolver o problema enquanto ainda somos vivos para estarmos interessados na sua resolução.

O estudo dos algoritmos, a algoritmia (algorithmics) é um campo muito importante da ciência da computação, que envolve por exemplo o estudo da sua correcção (verificação se de facto resolvem o problema), da sua finitude (será de facto um algoritmo, ou não passa dum "método computacional" [1] inútil na prática?) e da sua eficiência (análise de algoritmos). Estes temas serão inevitavelmente abordados nesta cadeira, embora informalmente, e serão fundamentados teoricamente na cadeira de Computação e Algoritmia. A cadeira Introdução à Programação (Programação I em IGE) serve portanto de ponte entre as cadeiras de Arquitectura de Computadores e Computação e Algoritmia, fornecendo os conhecimentos necessários para todo o trabalho subsequente em cadeiras de informática.

1.3.1 Um exemplo

Nota: Este exemplo faz uso de alguma simbologia a que pode não estar habituado. Recomenda-se a leitura do Apêndice A.

Seja o problema de, dados quaisquer dois inteiros positivos m e n, calcular os seu máximo divisor comum mdc(m, n).

A abordagem deste problema passa em primeiro lugar pela identificação da chamada pré-condição (PC), i.e., pelas condições que se verificam garantidamente à priori. Neste caso a pré-condição é PC: m, e n são inteiros positivos. Depois, deve-se formalizar a condição objectivo (CO). Neste caso a CO é: k = mdc(m, n). Assim, o objectivo é encontrar k que verifique a CO.

Para que o problema faça sentido, é necessário que, quaisquer que sejam m e n tais que a PC é verdadeira, exista pelo menos um inteiro positivo k tal que a CO é verdadeira. Para que a solução do problema não seja ambígua, é necessário restringir esta formulação para: quaisquer que sejam m e n tais que a PC é verdadeira, existe um e um só inteiro positivo k tal que a CO é verdadeira. Quando isto se verifica, pode-se dizer que o problema está bem colocado. É fácil verificar que, neste caso, o problema está bem colocado (note-se que a demonstração de que um problema está bem colocado muitas vezes se faz desenvolvendo um algoritmo: são as chamadas demonstrações construtivas).

Depois de se verificar que de facto o problema está bem colocado dadas a PC e a CO, é de todo o interesse identificar propriedades interessantes do mdc. Duas propriedades simples são:

a) Quaisquer que sejam m e n inteiros positivos, mdc(m, n) >= 1.
b) Quaisquer que sejam m e n inteiros positivos, mdc(m, n) <= min(m, n), em que min(m, n) é o menor dos dois valores m e n.

A veracidade destas duas propriedades é evidente, pelo que não se demonstra aqui.

Seja m % k uma notação que significa "o resto da divisão (inteira) de m por k", e seja <> o símbolo para a desigualdade. Duas outras propriedades que se verificará serem importantes são:

c) Quaisquer que sejam k, m e n inteiros positivos, k >= mdc(m, n) e (m % k = 0 e n % k = 0 [ou seja, k é divisor comum a m e n]) => k = mdc(m, n), em que e significa a conjunção. A demonstração pode ser feita por absurdo. Suponhamos que k não é o máximo divisor comum de m e n. Como k é divisor comum, então conclui-se que mdc(m, n) > k, isto é, há divisores comuns maiores que k. Mas então mdc(m, n) > k >= mdc(m, n), que é uma falsidade! Logo, k = mdc(m, n).
d) Quaisquer que sejam k, m e n inteiros positivos, k >= mdc(m, n) e (m % k <> 0 ou m % k <> 0 [ou seja, k não é divisor comum a m e n]) => k > mdc(m, n), sendo neste caso a demonstração trivial.

Em que é que estas propriedades nos ajudam? Em primeiro lugar, a) e b) restringem a zona onde o mdc deve ser procurado, o que é obviamente útil. As propriedades c) e d) serão úteis mais tarde.

Não há nenhum método mágico de resolver problemas. Mais tarde ver-se-á que existem metodologias que simplificam a abordagem ao desenvolvimento de algoritmos, nomeadamente envolvendo iterações (repetições). Mesmo essas metodologias não são substituto para a intuição e a inteligência: é necessário ter intuição. Para já, usar-se-á apenas a intuição. Onde se deve procurar o mdc? A intuição diz que a procura deve ser feita a partir de min(m, n), pois de outra forma, começando por 1, é fácil descobrir divisores comuns, mas não é evidente se eles são ou não o máximo divisor comum: seria necessário testar todos os outros potenciais divisores até min(m, n). Então, duma forma informal, deve-se ir procurando divisores comuns partindo de min(m, n) para baixo até se encontrar algum, que será forçosamente o mdc.

Como transformar estas ideias num algoritmo e, simultaneamente, demonstrar a sua correcção? Seja k uma variável inteira (i.e., uma "folha de papel" onde se pode escrever valores inteiros) que guarda os candidatos a divisores comuns. Então, se se quiser começar pelo topo, deve-se atribuir a k o menor dos valores m e n:

se m < n então:
k <- m
senão:
k <- n

em que "k <- n" significa "atribua-se o valor de n à variável k" (ou "apague-se a folha de papel k e escreva-se lá o valor de n".

Depois destas instruções, é evidente que se pode afirmar que k >= mdc(m, n), dada a propriedade b).

Em seguida, deve-se verificar se k divide m e n e, no caso contrário, passar ao próximo candidato:

enquando m % k <> 0 ou n % k <> 0 faça-se:
k <- k - 1

A condição que controla o ciclo (chama-se ciclo porque é uma instrução que implica a repetição cíclica de outra: k <- k - 1) chama-se guarda (G). Neste caso temos G: m % k <> 0 ou n % k <> 0. A instrução k <- k - 1 chama-se o " progresso" do ciclo.

Quando este ciclo terminar, k é o mdc. Como demonstrá-lo? Repare-se que, dadas as propriedades c) e d), quer a inicialização de k quer a guarda e progresso garantem que há uma condição que se mantém sempre válida, desde o início ao fim do ciclo: a chamada condição invariante (CI). Neste caso CI: k >= mdc(m, n). A demonstração da correcção do algoritmo passa pois por demonstrar que CI é sempre verdadeira e que quando o ciclo termina (i.e., G é falsa) temos forçosamente CO verdadeira, i.e., CI e ~ G => CO, onde ~ representa a negação.

Assim, dada a inicialização

se m < n então:
k <- m
senão:
k <- n

tem-se que k = min(m, n), o que, conjugado com a PC, nos garante que k >= mdc(m, n). Durante o ciclo, que acontece se a G for verdadeira? Diminui-se k de uma unidade, isto é progride-se. Mas, admitindo que a CI é verdadeira e sendo G também verdadeira, conclui-se pela propriedade d) que k > mdc(m, n). Mas, como k é um valor inteiro, isso é o mesmo que dizer que k - 1 >= mdc(m, n), donde, depois do progresso, CI continua verdadeira. No fundo, demonstrou-se por indução que CI se verifica do início ao final do ciclo. E, como CI e ~ G => CO, k termina de facto com o máximo divisor comum de m e n, quaisquer que sejam os seus valores, desde que inteiros e positivos.

Assim, o algoritmo completo é:

{PC: m e n são inteiros positivos.}
se m < n então
    k <- m
senão
    k <- n
{k = min(m, n) >= mdc(m, n), ou seja, a CI é verdadeira.}
enquando m % k <> 0 ou n % k <> 0 faça-se:
    {Aqui a G é verdadeira. Logo, pela propriedade d), a CI mantém-se verdadeira
      depois do seguinte progresso:}
    k <- k - 1
{Aqui a G é falsa. Logo, pela propriedade c), k = mdc(m, n), ou seja a CO é verdadeira.}

em que texto entre {} são comentários, não fazendo parte do algoritmo.

Uma questão importante que ficou por demonstrar é se é garantido que o ciclo termina sempre. Mas essa demonstração é simples. Em primeiro lugar, a inicialização garante que o valor inicial de k é >= 1 (pois m e n são inteiros positivos). O progresso, por outro lado, faz o valor de k diminuir. Como 1 é divisor comum de qualquer par de inteiros positivos, o ciclo, na pior das hipóteses, termina com k = 1 ao fim de no máximo min(m, n) - 1 repetições. Logo, é de facto um algoritmo, pois verifica a condição de finitude.

Resumindo, o conjunto de instruções que se apresentou é um algoritmo porque:

É finito, terminando sempre ao fim de no máximo min(m, n) - 1 repetições (iterações) do ciclo.
Está bem definido, pois cada passo do algoritmo está definido com precisão e sem ambiguidades.
Tem duas entradas, que são os valores m e n, pertencentes ao conjunto dos inteiros positivos.
Tem uma saída k que verifica k = mdc(m, n) = max {j inteiro positivo tal que m % j = 0 e n % j = 0}.
É eficaz, pois todas as operações do algoritmo podem ser feitas com exactidão e em tempo finito por uma pessoa usando usando um papel e um lápis (e alguma paciência).

Quanto à sua eficiência, pode-se desde já afirmar que é suficientemente rápido para se poder usar na prática, muito embora existam algoritmos muito mais eficientes, que serão abordados em aulas posteriores. A análise da eficiência deste algoritmo fica como exercício de Computação e Algoritmia...

Algumas observações:

Este ciclo não foi obtido pela aplicação directa da metodologia de desenvolvimentos de ciclos que será ensinada mais tarde e formalizada em Computação e Algoritmia, mas poderia ter sido. Quando a aprender, volte aqui para verificar que o ciclo pode ser obtido usando a factorização da CO, ou seja (Q significa qualquer que seja):

PC: m > 0 e n > 0
CO: k > 0 e m % k = 0 e n % k = 0 e (Q i : 0 < i < k : m % k <> 0 ou n % k <> 0)
CI: k > 0 e (Q i : 0 < i < k : m % k <> 0 ou n % k <> 0)
G: m % k <> 0 ou n % k <> 0

O algoritmo foi desenvolvido usando:

Propriedades do mdc: ver abaixo.
Intuição: nada a substitui, mas a formalização suporta-a.

Versões mais eficientes do algoritmo podem ser obtidas pela aplicação das seguintes propriedades do mdc:

Quaisquer que sejam a e b inteiros positivos mdc(a, b) = mdc(b % a, a).
Se a = 0 e b > 0, então mdc(a, b) = b.

1.4 Programas

Como se viu, um programa é a concretização, numa dada linguagem de programação, de um determinado algoritmo (que resolve um problema concreto). Nesta cadeira ir-se-á utilizar a linguagem C++. Esta linguagem tem o seu próprio léxico, a sua sintaxe, a sua gramática e a sua semântica (embora simples). Todos estes aspectos do C++ serão tratados ao longo das aulas. Para já, no entanto, apresenta-se sem mais explicações a tradução do algoritmo do mdc para C++. O programa resultante é suficientemente simples para que possa ser entendido quase na sua totalidade. Se ficar com dúvidas, regresse a este exemplo mais tarde.

// Este programa calcula o máximo divisor comum de dois números.
#include <iostream>
using namespace std;

int main(void)
{
    cout << "Cálculo do máximo divisor comum de dois números." << endl;
    cout << "Introduza dois inteiros positivos: ";
    int m, n;
    cin >> m >> n;

    // Assume-se que m e n são positivos!

    // Como um divisor é sempre menor ou igual a um número, escolhe-se
    // o mínimo dos dois!
    int k;
    if(n > m)
        k = m;
    else
        k = n;

    // Neste momento sabe-se que k >= mdc(m, n). */

    while(m % k != 0 || n % k != 0) {
        // Se o ciclo não parou, então k não divide m e n, logo, 
        // k != mdc(m, n) e k >= mdc(m, n).  Ou seja, k > mdc(m, n).
        k--; 
        // Progresso.  Afinal, o algoritmo tem de terminar...
        // Neste momento, k >= mdc(m, n) outra vez!  É o invariante do
        // ciclo!
    }
    // Como k >= mdc(m, n) (invariante do ciclo) e k divide m e n
    // (o ciclo terminou, não foi?), conclui-se que k = mdc(m, n)!
    
    cout << "O máximo divisor comum de " << m << " e " << n << " é "
         << k << endl;
}

1.5 Resumo: resolução de problemas

Resumindo, a resolução de problemas usando linguagens de programação de alto nível tem vários passos (entre [] indica-se quem executa o respectivo passo):

Especificação do problema [humano].
Desenvolvimento de um algoritmo que resolve o problema [humano]. É neste passo que se faz mais uso da inteligência.
Concretização do algoritmo na linguagem de programação: desenvolvimento do programa [humano]. Este passo é mecânico e pouco interessante.
Tradução do programa para linguagem máquina [computador].
Execução do programa para resolver um problema particular (e.g., mdc(131, 47)) [computador].

Podem ocorrer erros em todos estes passos. No primeiro, se o problema estiver mal especificado. No segundo ocorrem os chamados erros lógicos: o algoritmo desenvolvido na realidade não resolve o problema tal como especificado. É aqui que os erros são mais dramáticos, daí que seja extremamente importante assegurar a correcção dos algoritmos desenvolvidos. No terceiro passo, os erros mais benévolos são os que conduzem a erros sintácticos ou gramaticais, pois o compilador assiná-la-os. Neste passo os piores erros são gralhas que alteram a semântica do programa sem o invalidar sintacticamente. Por exemplo, escrever 1 em vez de l (letra 'l', por exemplo o nome duma variável) pode ter consequências muito graves. Estes erros são normalmente muito difíceis de detectar *. Finalmente, a ocorrência de erros nos dois últimos passos é tão improvável que mais vale assumir que não podem ocorrer de todo.

* Estes erros assemelham-se ao "não" introduzido (acidentalmente?) pelo revisor de provas em "História do cerco de Lisboa", de José Saramago.

1.6 Exercícios

1.a) Passe para o editor o programa do mdc que se encontra acima. Ignore os comentários (um comentário começa em // e vai até ao fim da linha).

1.b) Compile e execute o programa.

1.c) Corra o programa linha a linha em modo de depuração (debug), observando atentamente a evolução do valor das variáveis.

1.d) Experimente fazer as seguintes alterações:

Modifique a linha onde escreveu "int m, n;", para "int m n;".
Modifique a linha onde escreveu "if(n > m)", para "if(n > m".
Modifique a linha onde escreveu "k--;", para "k--".
Modifique a linha onde escreveu "cout << "Cálculo do máximo divisor comum de dois números" << endl;", para "cout << "Cálculo do máximo divisor comum de dois números";".
Modifique a linha onde escreveu "while(m % k != 0 || n % k != 0)", para "while((m % k != 0 || n % k != 0)".
Apague uma das linhas onde escreveu "}".
Modifique a linha onde escreveu "#include <iostream>", para "//#include<iostream>".

Após cada alteração tente compilar e executar o programa. Interprete os resultados.

1.7 Referências

[1] Donald E. Knuth, "Fundamental algorithms", volume 1 de "The Art of Computer Programming", segunda edição, segunda edição, Addison-Wesley Publishing Company, Reading, Massachusetts, 1973.