1 Introdução à programação

It has often been said that a person does not really understand

something until after teaching it to someone else. Actually, a person

does not really understand something until after teaching it to

a computer (...)

Donald E. Knuth, Selected Papers in Computer Science, 10 (1996)

1.1 Computadores

O que é um computador? As respostas que surgem com mais frequência são que um computador é um conjunto de circuitos integrados, uma ferramenta ou uma máquina programável. Todas estas respostas são verdadeiras, até certo ponto. No entanto, um rádio também é um conjunto de circuitos integrados, um martelo uma ferramenta, e uma máquina de lavar roupa uma máquina programável... Algo mais terá de se usar para distinguir um computador dum rádio, dum martelo, ou duma máquina de lavar roupa. A distinção principal está em que um computador pode ser programado para resolver virtualmente qualquer problema ou realizar praticamente qualquer tarefa, ao contrário da máquina de lavar roupa em que existe um conjunto muito pequeno de possíveis programas à escolha e que estão pré-definidos. I.e., um computador tipicamente não tem nenhuma aplicação específica: é uma máquina genérica. Claro que um computador usado para meras tarefas de secretariado (onde se utilizam os ditos "conhecimentos de informática do ponto de vista do utilizador") não é muito diferente duma máquina de lavar roupa ou duma máquina de escrever electrónica.

Um computador é portanto uma máquina programável de aplicação genérica. Serve para resolver problemas de muitos tipos diferentes, desde o problema de secretaria mais simples, passando pelo apoio à gestão de empresas, até ao controlo de autómatos e à construção de sistemas inteligentes. O objectivo desta disciplina é ensinar os princípios da resolução de problemas através dum computador.

Os computadores têm uma arquitectura que, nos seus traços gerais, não parece muito complicada. No essencial, os computadores consistem num processador (o "cérebro") que, para além de dispor de um conjunto de registos ("memória de curta duração"), tem acesso a uma memória ("memória de média duração") e a um conjunto de dispositivos de entrada e saída de dados, entre os quais tipicamente discos rígidos ("memória de longa duração"), um teclado e um ecrã. Esta é uma descrição simplista dum computador. Na disciplina de Arquitectura de Computadores os vários componentes de um computador serão estudados com mais profundidade. Na disciplina de Sistemas Operativos, por outro lado, estudar-se-ão os programas que normalmente equipam os computadores de modo a simplificar a sua utilização.

1.2 Programação

Como se programa um computador? Os computadores, como se verá na disciplina de Arquitectura de Computadores, entendem uma linguagem própria, usualmente conhecida por "linguagem máquina". Esta linguagem caracteriza-se por não ter qualquer tipo de ambiguidades: a interpretação das instruções é única. Por outro lado, esta linguagem também se caracteriza por consistir num conjunto de comandos ou instruções que são executados "cegamente" pelo computador: é uma linguagem imperativa. Os vários tipos de linguagens (imperativas, declarativas, etc.), as várias formas de classificar as linguagens e as vantagens e desvantagens de cada tipo de linguagem serão estudados na disciplina de Linguagens de Programação.

A linguagem máquina caracteriza-se também por ser penosa de utilizar para os humanos: todas as instruções correspondem a códigos numéricos, difíceis de memorizar, e as instruções são muito elementares. Uma solução parcial passa por atribuir a cada instrução uma dada mnemónica, ou seja, substituir os números que representam cada operação por nomes mais fáceis de decorar. Às linguagens assim definidas chama-se linguagens assembly e aos tradutores de assembly para linguagem máquina assemblers ou assembladores.

Uma solução preferível passa por equipar os computadores com compiladores, isto é com programas que são capazes de traduzir para linguagem máquina programas escritos em linguagens mais fáceis de usar pelo programador e mais poderosas que o assembly. Infelizmente, não existem ainda compiladores para as linguagens naturais, que é o nome que se dá às linguagens humanas (e.g., português, inglês, etc.). Mas existem as chamadas linguagens de programação de alto nível (alto nível entre as linguagens de programação, bem entendido), que se aproximam um pouco mais das linguagens naturais na sua facilidade de utilização pelos humanos, sem no entanto introduzirem as imprecisões, ambiguidades e dependências de contextos externos que são características das linguagens naturais. Nesta disciplina usar-se-á o C++ como linguagem de programação *.

Tal como o conhecimento profundo do português não chega para fazer um bom escritor, o conhecimento profundo duma linguagem de programação não chega para fazer um bom programador, longe disso. O conhecimento da linguagem é necessário, mas não é de todo suficiente. Programar não é o simples acto de escrever ideias de outrem: é ter essas ideias, é ser criativo e engenhoso. Resolver problemas exige conhecimentos da linguagem, conhecimento das técnicas conhecidas de ataque aos problemas, inteligência para fazer analogias com outros problemas, mesmo em áreas totalmente desconexas, criatividade, intuição, engenho, persistência, etc. Programar não é um acto mecânico. Assim, aprender a programar consegue-se através do estudo e, fundamentalmente, do treino.

* Pode-se pensar num computador equipado com um compilador duma dada linguagem de programação como um novo computador, mais poderoso. É de toda a conveniência usar este tipo de abstracção, que de resto será muito útil para perceber sistemas operativos, onde se vão acrescentando camada após camada de software para acrescentar "inteligência" aos computadores.

1.3 Algoritmos: resolvendo problemas

Dado um problema que é necessário resolver, como desenvolver uma solução? Como expressá-la? À última pergunta responde-se muito facilmente: usando uma linguagem. A primeira é mais difícil. Se a solução desenvolvida corresponder a um conjunto de instruções bem definidas e sem qualquer ambiguidade, podemos dizer que temos um algoritmo que resolve um problema, i.e., que a partir dum conjunto de entradas produz determinadas saídas.

A noção de algoritmo não é simples de perceber, pois é uma abstracção. Algoritmos são métodos de resolver problemas. Mas à concretização dum algoritmo numa dada linguagem já não se chama algoritmo: chama-se programa. Sob esse ponto de vista, todas as versões escritas dum algoritmo são programas, mesmo que expressos numa linguagem natural, desde que não façam uso da sua característica ambiguidade. Abusando um pouco das definições, no entanto, chamaremos algoritmo a um método de resolução de um dado problema expresso em linguagem natural, e programa à concretização de um algoritmo numa dada linguagem de programação.

A definição de algoritmo é um pouco mais completa do que a apresentada. De acordo com Knuth [1] os algoritmos têm cinco características importantes:

Finitude - Um algoritmo tem de terminar sempre ao fim de um número finito de passos. De nada nos serve um algoritmo se existirem casos em que não termina.
Definitude* - Cada passo do algoritmo tem de ser definido com precisão; as acções a executar têm de ser especificadas rigorosamente e sem ambiguidade. No fundo isto significa que um algoritmo tem de ser tão bem especificado que até um computador possa seguir as suas instruções.
Entrada - Um algoritmo pode ter zero ou mais entradas, i.e., entidades que lhe são dadas inicialmente, antes do algoritmo começar. Essas entidades pertencem a um conjunto bem definido (e.g., o conjunto dos números inteiros). Note-se que existem algoritmos interessantes que não têm qualquer entrada, embora sejam raros.
Saída - Um algoritmo tem uma ou mais saídas, i.e., entidades que têm uma relação bem definida com as entradas (o problema resolvido pelo algoritmo é o de calcular as saídas correspondentes às entradas).
Eficácia - Todas as operações executadas no algoritmo têm de ser suficientemente básicas para, em princípio, poderem ser feitas com exactidão e em tempo finito por uma pessoa usando um papel e um lápis.

* Definitude: qualidade daquilo que é definido.

Para além destas características dos algoritmos, pode-se também falar da sua eficiência, isto é, do tempo que demoram a ser executados para dadas entradas. Em geral, portanto, pretende-se que os algoritmos sejam não só finitos mas também suficientemente rápidos [1]. Ou seja, devem resolver o problema em tempo útil (e.g., enquanto ainda somos vivos para estarmos interessados na sua resolução) mesmo para a mais desfavorável combinação possível das entradas.

O estudo dos algoritmos, a algoritmia (algorithmics), é um campo muito importante da ciência da computação, que envolve por exemplo o estudo da sua correcção (verificação se de facto resolvem o problema), da sua finitude (será de facto um algoritmo, ou não passa dum "método computacional" [1] inútil na prática?) e da sua eficiência (análise de algoritmos). Estes temas serão inevitavelmente abordados nesta disciplina, embora informalmente, e serão fundamentados teoricamente na disciplina de Computação e Algoritmia. A disciplina de Introdução à Programação serve portanto de ponte entre as disciplinas de Arquitectura de Computadores e Computação e Algoritmia, fornecendo os conhecimentos necessários para todo o trabalho subsequente noutras disciplinas da área da informática.

1.3.1 Um exemplo

Nota: Este exemplo faz uso de alguma simbologia a que pode não estar habituado. Recomenda-se a leitura do Apêndice A.

Seja o problema de, dados quaisquer dois inteiros positivos m e n, calcular os seu máximo divisor comum mdc(m, n).

A abordagem deste problema passa em primeiro lugar pela identificação da chamada pré-condição (PC), i.e., pelas condições que se verificam garantidamente à priori. Neste caso a pré-condição é

PC: m, e n são inteiros positivos.

Depois, deve-se formalizar a condição objectivo (CO). Neste caso a condição objectivo é

CO é: k = mdc(m, n).

Assim, neste caso o objectivo do problema é encontrar um k que verifique a CO.

Para que o problema faça sentido, é necessário que, quaisquer que sejam m e n tais que a PC é verdadeira, exista pelo menos um inteiro positivo k tal que a CO é verdadeira. No problema em causa não há quaisquer dúvidas: todos os pares de inteiros positivos têm um máximo divisor comum.

Para que a solução do problema não seja ambígua, é necessário garantir mais. Não basta que exista solução, é necessário que seja única: quaisquer que sejam m e n tais que a PC é verdadeira, existe um e um só inteiro positivo k tal que a CO é verdadeira. Quando isto se verifica, pode-se dizer que o problema está bem colocado (note-se que a demonstração de que um problema está bem colocado muitas vezes se faz desenvolvendo um algoritmo: são as chamadas demonstrações construtivas). É fácil verificar que, neste caso, o problema está bem colocado: existe apenas um mdc de cada para de inteiros positivos.

Depois de se verificar que de facto o problema está bem colocado dadas a PC e a CO, é de todo o interesse identificar propriedades interessantes do mdc. Duas propriedades simples são:

a) Quaisquer que sejam m e n inteiros positivos, mdc(m, n) >= 1.
b) Quaisquer que sejam m e n inteiros positivos, mdc(m, n) <= min(m, n), em que min(m, n) é o menor dos dois valores m e n.

A veracidade destas duas propriedades é evidente, pelo que não se demonstra aqui.

Seja m ÷ k uma notação que significa "o resto da divisão (inteira) de m por k", e seja <> o símbolo para a desigualdade, de acordo com o Apêndice A. Duas outras propriedades que se verificará serem importantes são:

c) Quaisquer que sejam k, m e n inteiros positivos,

k >= mdc(m, n) e (m ÷ k = 0 e n ÷ k = 0) implica k = mdc(m, n),
em que e significa a conjunção. Ou seja, se k é superior ou igual ao máximo divisor comum de m e n e se k é divisor comum de m e n, então k é o máximo divisor comum de m e n. A demonstração pode ser feita por absurdo. Suponhamos que k não é o máximo divisor comum de m e n. Como k é divisor comum, então conclui-se que mdc(m, n) > k, isto é, há divisores comuns maiores que k. Mas então mdc(m, n) > k >= mdc(m, n), que é uma falsidade! Logo, k = mdc(m, n).
d) Quaisquer que sejam k, m e n inteiros positivos,

k >= mdc(m, n) e (m ÷ k <> 0 ou m ÷ k <> 0) implicak > mdc(m, n),
em que ou significa a disjunção. Ou seja, se k é superior ou igual ao máximo divisor comum de m e n e se k não é divisor comum de m e n, então k é maior que o máximo divisor comum de m e n. Neste caso a demonstração é trivial.

Em que é que estas propriedades nos ajudam? Em primeiro lugar, a) e b) restringem a gama de possíveis divisores, i.e., o intervalo dos inteiros onde o mdc deve ser procurado, o que é obviamente útil. As propriedades c) e d) serão úteis mais tarde.

Não há nenhum método mágico de resolver problemas. Mais tarde ver-se-á que existem metodologias que simplificam a abordagem ao desenvolvimento de algoritmos, nomeadamente aqueles que envolvem iterações (repetições). Mesmo essas metodologias não são substituto para o engenho e a inteligência. Para já, usar-se-á apenas a intuição. Onde se deve procurar o mdc? A intuição diz que a procura deve ser feita a partir de min(m, n), pois de outra forma, começando por 1, é fácil descobrir divisores comuns, mas não é evidente se eles são ou não o máximo divisor comum: seria necessário testar todos os outros potenciais divisores até min(m, n). Deve-se portanto ir procurando divisores comuns partindo de min(m, n) para baixo até se encontrar algum, que será forçosamente o mdc.

Como transformar estas ideias num algoritmo e, simultaneamente, demonstrar a sua correcção? Seja k uma variável inteira (i.e., uma "folha de papel" onde se pode escrever valores inteiros) que guarda os candidatos a divisores comuns. Então, se se quiser começar pelo topo, deve-se atribuir a k (escrever na folha de papel) o menor dos valores m e n:

se m < n então:
k <- m
senão:
k <- n

em que "k <- n" significa "atribua-se o valor de n à variável k" (ou "apague-se a folha de papel k e escreva-se lá o valor de n".

Depois destas instruções, é evidente que se pode afirmar que k >= mdc(m, n), dada a propriedade b).

Em seguida, deve-se verificar se k divide m e n e, no caso contrário, passar ao próximo candidato:

enquanto m ÷ k <> 0 ou n ÷ k <> 0 faça-se:
k <- k - 1

A condição que controla o ciclo (chama-se ciclo porque é uma instrução que implica a repetição cíclica de outra: k <- k - 1) chama-se guarda (G). Neste caso temos

G: m ÷ k <> 0 ou n ÷ k <> 0.

A instrução k <- k - 1 chama-se o " progresso" do ciclo pois, como se verá, é ela que garante que o ciclo progride em direcção ao seu fim.

Quando este ciclo terminar, k é o mdc. Como demonstrá-lo? Repare-se que, dadas as propriedades c) e d), quer a inicialização de k quer a guarda e progresso garantem que há uma condição que se mantém sempre válida, desde o início ao fim do ciclo: a chamada condição invariante (CI). Neste caso

CI: k >= mdc(m, n).

Dada a inicialização

se m < n então:
k <- m
senão:
k <- n

e a PC, tem-se que k = min(m, n), o que, conjugado com a propriedade b), nos garante que k >= mdc(m, n).

Durante o ciclo, que acontece se a G for verdadeira? Diminui-se k de uma unidade, isto é progride-se. Mas, admitindo que a CI é verdadeira e sendo G também verdadeira, conclui-se pela propriedade d) que

k > mdc(m, n).

Mas, como k é um valor inteiro, isso é o mesmo que dizer que k - 1 >= mdc(m, n). Donde, depois do progresso k <- k - 1, a veracidade da CI é recuperada, i.e., k >= mdc(m, n).

No fundo, demonstrou-se por indução que, como CI se verifica do início do ciclo, também se verifica durante todo o ciclo, inclusivé quando este termina. Ou seja, demonstrou-se que CI é de facto invariante.

Que acontece se, durante o ciclo, G for falsa? Nesse caso o ciclo termina e conclui-se que há duas condições verdadeiras: CI e ¬G (onde ¬ representa a negação). Mas a conjunção destas condições, pela propriedade c), implica que a CO é verdadeira, i.e., que k termina de facto com o máximo divisor comum de m e n.

A demonstração da correcção do algoritmo passa pois por demonstrar que CI é verdadeira do início ao fim do ciclo (é invariante) e que quando o ciclo termina (i.e., quando a G é falsa) temos forçosamente que a CO verdadeira, i.e.,

CI e ¬G implica CO.

Assim, o algoritmo completo é:

{PC: m > 0 e n > 0.}
se m < n então
    k <- m
senão
    k <- n
{Aqui sabe-se que k = min(m, n) >= mdc(m, n), ou seja, que a CI é verdadeira.}
enquanto m ÷ k <> 0 ou n ÷ k <> 0 faça-se:
    {Aqui a G é verdadeira. Logo, pela propriedade d), a CI mantém-se verdadeira
      depois do seguinte progresso:}
    k <- k - 1
{Aqui a G é falsa. Logo, pela propriedade c), k = mdc(m, n), ou seja a CO é verdadeira.}

onde o texto entre {} corresponde a comentários, não fazendo parte do algoritmo.

Uma questão importante que ficou por demonstrar é se é garantido que o ciclo termina sempre. Se não se garantir não se pode chamar a esta sequência de instruções um algoritmo.

A demonstração é simples. Em primeiro lugar, a inicialização garante que o valor inicial de k é >= 1 (pois m e n são inteiros positivos). O progresso, por outro lado, faz o valor de k diminuir a cada repetição. Como 1 é divisor comum de qualquer par de inteiros positivos, o ciclo, na pior das hipóteses, termina com k = 1 ao fim de no máximo min(m, n) - 1 repetições. Logo, é de facto um algoritmo, pois verifica a condição de finitude.

Resumindo, o conjunto de instruções que se apresentou é um algoritmo porque:

é finito, terminando sempre ao fim de no máximo min(m, n) - 1 repetições (iterações) do ciclo;
está bem definido, pois cada passo do algoritmo está definido com precisão e sem ambiguidades;
tem duas entradas, que são os valores m e n, pertencentes ao conjunto dos inteiros positivos;
tem uma saída k que verifica k = mdc(m, n) = max {j inteiro positivo tal que m ÷ j = 0 en ÷ j = 0}; e
é eficaz, pois todas as operações do algoritmo podem ser feitas com exactidão e em tempo finito por uma pessoa usando um papel e um lápis (e alguma paciência).

Quanto à sua eficiência, pode-se desde já afirmar que é suficientemente rápido para se poder usar na prática, muito embora existam algoritmos muito mais eficientes, que serão abordados em aulas posteriores. A análise da eficiência deste algoritmo fica como exercício de Computação e Algoritmia...

Algumas observações:

Este ciclo não foi obtido pela aplicação directa da metodologia de desenvolvimentos de ciclos que será ensinada mais tarde e formalizada em Computação e Algoritmia, mas poderia ter sido. Quando a aprender, volte aqui para verificar que o ciclo pode ser obtido usando a factorização da CO, ou seja (Q significa qualquer que seja):

PC: m > 0 e n > 0.
CO: k > 0 e m ÷ k = 0 en ÷ k = 0 e (Q i : 0 < i < k : m ÷ i <> 0 ou n ÷ i <> 0).
CI: k > 0 e (Q i : 0 < i < k : m ÷ i <> 0 ou n ÷ i <> 0).
G: m ÷ k <> 0 ou n ÷ k <> 0

O algoritmo foi desenvolvido usando:

Propriedades do mdc: ver abaixo outras propriedades mais interessantes.
Intuição: nada a substitui, mas a formalização suporta-a.

Versões mais eficientes do algoritmo podem ser obtidas pela aplicação das seguintes propriedades do mdc:

Quaisquer que sejam a e b inteiros positivos mdc(a, b) = mdc(b ÷ a, a).
Se a = 0 e b > 0, então mdc(a, b) = b.

1.4 Programas

Como se viu, um programa é a concretização, numa dada linguagem de programação, de um determinado algoritmo (que resolve um problema concreto). Nesta disciplina ir-se-á utilizar a linguagem C++. Esta linguagem tem o seu próprio léxico, a sua sintaxe, a sua gramática e a sua semântica (embora simples). Todos estes aspectos do C++ serão tratados ao longo das aulas. Para já, no entanto, apresenta-se sem mais explicações a tradução do algoritmo do mdc para C++. O programa resultante é suficientemente simples para que possa ser entendido quase na sua totalidade. Se ficar com dúvidas, regresse a este exemplo mais tarde.

// Este programa calcula o máximo divisor comum de dois números.
#include <iostream>
using namespace std;
int main()
{
    cout << "Cálculo do máximo divisor comum de dois números."
         << endl;
    cout << "Introduza dois inteiros positivos: ";
    int m, n;
    cin >> m >> n;
    // Assume-se que m e n são positivos!
    // Como um divisor é sempre menor ou igual a um número, escolhe-se
    // o mínimo dos dois!
    int k;
    if(n > m)
        k = m;
    else
        k = n;
    // Neste momento sabe-se que k >= mdc(m, n).
    while(m % k != 0 || n % k != 0) {
        // Se o ciclo não parou, então k não divide m e n, logo,
        // k <> mdc(m, n) e k >= mdc(m, n). Ou seja, k > mdc(m, n).
        --k;
        // Progresso. Afinal, o algoritmo tem de terminar...
        // Neste momento, k >= mdc(m, n) outra vez! É o invariante do
        // ciclo!
    }
    // Como k >= mdc(m, n) (invariante do ciclo) e k divide m e n
    // (o ciclo terminou, não foi?), conclui-se que k = mdc(m, n)!
    cout << "O máximo divisor comum de " << m << " e " << n
         << " é " << k << endl;
}

1.5 Resumo: resolução de problemas

Resumindo, a resolução de problemas usando linguagens de programação de alto nível tem vários passos (entre [] indica-se quem executa o respectivo passo):

Especificação do problema [humano].
Desenvolvimento de um algoritmo que resolve o problema [humano]. É neste passo que se faz mais uso da inteligência e criatividade.
Concretização do algoritmo na linguagem de programação: desenvolvimento do programa [humano]. Este passo é mecânico e relativamente pouco interessante.
Tradução do programa para linguagem máquina [computador].
Execução do programa para resolver um problema particular (e.g., mdc(131, 47)) [computador].

Podem ocorrer erros em todos estes passos. No primeiro, se o problema estiver mal especificado. No segundo ocorrem os chamados erros lógicos: o algoritmo desenvolvido na realidade não resolve o problema tal como especificado. É aqui que os erros são mais dramáticos, daí que seja extremamente importante assegurar a correcção dos algoritmos desenvolvidos. No terceiro passo, os erros mais benévolos são os que conduzem a erros sintácticos ou gramaticais, pois o compilador assinala-os. Neste passo os piores erros são gralhas que alteram a semântica do programa sem o invalidar sintacticamente. Por exemplo, escrever 1 em vez de l (letra 'l', por exemplo o nome duma variável) pode ter consequências muito graves. Estes erros são normalmente muito difíceis de detectar *. Finalmente, a ocorrência de erros nos dois últimos passos é tão improvável que mais vale assumir que não podem ocorrer de todo.

* Estes erros assemelham-se ao "não" introduzido (acidentalmente?) pelo revisor de provas em "História do cerco de Lisboa", de José Saramago.

1.6 Exercícios

[Incompleto, ver páginas mais recentes.]

Entretanto consulte as aulas práticas.

1.7 Referências

[1] Donald E. Knuth, "Fundamental algorithms", volume 1 de "The Art of Computer Programming", segunda edição, Addison-Wesley Publishing Company, Reading, Massachusetts, 1973. *

* Existe na biblioteca do ISCTE.