From 4d4e7037c5a426bc2184174dee53f8febf837654 Mon Sep 17 00:00:00 2001
From: Eduardo de Santana Medeiros Alexandre <eduardo.ufpb@gmail.com>
Date: Thu, 25 Sep 2014 10:49:29 -0300
Subject: [PATCH] =?UTF-8?q?Remo=C3=A7=C3=A3o=20do=20livro.html?=
MIME-Version: 1.0
Content-Type: text/plain; charset=UTF-8
Content-Transfer-Encoding: 8bit

---
 livro/livro.html | 4684 ----------------------------------------------
 1 file changed, 4684 deletions(-)
 delete mode 100644 livro/livro.html
diff --git a/livro/livro.html b/livro/livro.html
deleted file mode 100644
index 0149bd1..0000000
--- a/livro/livro.html
+++ /dev/null
@@ -1,4684 +0,0 @@
-<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.1//EN"
-    "http://www.w3.org/TR/xhtml11/DTD/xhtml11.dtd">
-<html xmlns="http://www.w3.org/1999/xhtml" xml:lang="pt-BR">
-<head>
-<meta http-equiv="Content-Type" content="application/xhtml+xml; charset=UTF-8" />
-<meta name="generator" content="AsciiDoc 8.6.6" />
-<meta name="description" content="Livro de Introdução à Arquitetura de Computadores" />
-<meta name="keywords" content="Computação" />
-<title>Introdução a Arquitetura de Computadores</title>
-<style type="text/css">
-/* Shared CSS for AsciiDoc xhtml11 and html5 backends */
-
-/* Default font. */
-body {
-  font-family: Georgia,serif;
-}
-
-/* Title font. */
-h1, h2, h3, h4, h5, h6,
-div.title, caption.title,
-thead, p.table.header,
-#toctitle,
-#author, #revnumber, #revdate, #revremark,
-#footer {
-  font-family: Arial,Helvetica,sans-serif;
-}
-
-body {
-  margin: 1em 5% 1em 5%;
-}
-
-a {
-  color: blue;
-  text-decoration: underline;
-}
-a:visited {
-  color: fuchsia;
-}
-
-em {
-  font-style: italic;
-  color: navy;
-}
-
-strong {
-  font-weight: bold;
-  color: #083194;
-}
-
-h1, h2, h3, h4, h5, h6 {
-  color: #527bbd;
-  margin-top: 1.2em;
-  margin-bottom: 0.5em;
-  line-height: 1.3;
-}
-
-h1, h2, h3 {
-  border-bottom: 2px solid silver;
-}
-h2 {
-  padding-top: 0.5em;
-}
-h3 {
-  float: left;
-}
-h3 + * {
-  clear: left;
-}
-h5 {
-  font-size: 1.0em;
-}
-
-div.sectionbody {
-  margin-left: 0;
-}
-
-hr {
-  border: 1px solid silver;
-}
-
-p {
-  margin-top: 0.5em;
-  margin-bottom: 0.5em;
-}
-
-ul, ol, li > p {
-  margin-top: 0;
-}
-ul > li     { color: #aaa; }
-ul > li > * { color: black; }
-
-pre {
-  padding: 0;
-  margin: 0;
-}
-
-#author {
-  color: #527bbd;
-  font-weight: bold;
-  font-size: 1.1em;
-}
-#email {
-}
-#revnumber, #revdate, #revremark {
-}
-
-#footer {
-  font-size: small;
-  border-top: 2px solid silver;
-  padding-top: 0.5em;
-  margin-top: 4.0em;
-}
-#footer-text {
-  float: left;
-  padding-bottom: 0.5em;
-}
-#footer-badges {
-  float: right;
-  padding-bottom: 0.5em;
-}
-
-#preamble {
-  margin-top: 1.5em;
-  margin-bottom: 1.5em;
-}
-div.imageblock, div.exampleblock, div.verseblock,
-div.quoteblock, div.literalblock, div.listingblock, div.sidebarblock,
-div.admonitionblock {
-  margin-top: 1.0em;
-  margin-bottom: 1.5em;
-}
-div.admonitionblock {
-  margin-top: 2.0em;
-  margin-bottom: 2.0em;
-  margin-right: 10%;
-  color: #606060;
-}
-
-div.content { /* Block element content. */
-  padding: 0;
-}
-
-/* Block element titles. */
-div.title, caption.title {
-  color: #527bbd;
-  font-weight: bold;
-  text-align: left;
-  margin-top: 1.0em;
-  margin-bottom: 0.5em;
-}
-div.title + * {
-  margin-top: 0;
-}
-
-td div.title:first-child {
-  margin-top: 0.0em;
-}
-div.content div.title:first-child {
-  margin-top: 0.0em;
-}
-div.content + div.title {
-  margin-top: 0.0em;
-}
-
-div.sidebarblock > div.content {
-  background: #ffffee;
-  border: 1px solid #dddddd;
-  border-left: 4px solid #f0f0f0;
-  padding: 0.5em;
-}
-
-div.listingblock > div.content {
-  border: 1px solid #dddddd;
-  border-left: 5px solid #f0f0f0;
-  background: #f8f8f8;
-  padding: 0.5em;
-}
-
-div.quoteblock, div.verseblock {
-  padding-left: 1.0em;
-  margin-left: 1.0em;
-  margin-right: 10%;
-  border-left: 5px solid #f0f0f0;
-  color: #888;
-}
-
-div.quoteblock > div.attribution {
-  padding-top: 0.5em;
-  text-align: right;
-}
-
-div.verseblock > pre.content {
-  font-family: inherit;
-  font-size: inherit;
-}
-div.verseblock > div.attribution {
-  padding-top: 0.75em;
-  text-align: left;
-}
-/* DEPRECATED: Pre version 8.2.7 verse style literal block. */
-div.verseblock + div.attribution {
-  text-align: left;
-}
-
-div.admonitionblock .icon {
-  vertical-align: top;
-  font-size: 1.1em;
-  font-weight: bold;
-  text-decoration: underline;
-  color: #527bbd;
-  padding-right: 0.5em;
-}
-div.admonitionblock td.content {
-  padding-left: 0.5em;
-  border-left: 3px solid #dddddd;
-}
-
-div.exampleblock > div.content {
-  border-left: 3px solid #dddddd;
-  padding-left: 0.5em;
-}
-
-div.imageblock div.content { padding-left: 0; }
-span.image img { border-style: none; }
-a.image:visited { color: white; }
-
-dl {
-  margin-top: 0.8em;
-  margin-bottom: 0.8em;
-}
-dt {
-  margin-top: 0.5em;
-  margin-bottom: 0;
-  font-style: normal;
-  color: navy;
-}
-dd > *:first-child {
-  margin-top: 0.1em;
-}
-
-ul, ol {
-    list-style-position: outside;
-}
-ol.arabic {
-  list-style-type: decimal;
-}
-ol.loweralpha {
-  list-style-type: lower-alpha;
-}
-ol.upperalpha {
-  list-style-type: upper-alpha;
-}
-ol.lowerroman {
-  list-style-type: lower-roman;
-}
-ol.upperroman {
-  list-style-type: upper-roman;
-}
-
-div.compact ul, div.compact ol,
-div.compact p, div.compact p,
-div.compact div, div.compact div {
-  margin-top: 0.1em;
-  margin-bottom: 0.1em;
-}
-
-tfoot {
-  font-weight: bold;
-}
-td > div.verse {
-  white-space: pre;
-}
-
-div.hdlist {
-  margin-top: 0.8em;
-  margin-bottom: 0.8em;
-}
-div.hdlist tr {
-  padding-bottom: 15px;
-}
-dt.hdlist1.strong, td.hdlist1.strong {
-  font-weight: bold;
-}
-td.hdlist1 {
-  vertical-align: top;
-  font-style: normal;
-  padding-right: 0.8em;
-  color: navy;
-}
-td.hdlist2 {
-  vertical-align: top;
-}
-div.hdlist.compact tr {
-  margin: 0;
-  padding-bottom: 0;
-}
-
-.comment {
-  background: yellow;
-}
-
-.footnote, .footnoteref {
-  font-size: 0.8em;
-}
-
-span.footnote, span.footnoteref {
-  vertical-align: super;
-}
-
-#footnotes {
-  margin: 20px 0 20px 0;
-  padding: 7px 0 0 0;
-}
-
-#footnotes div.footnote {
-  margin: 0 0 5px 0;
-}
-
-#footnotes hr {
-  border: none;
-  border-top: 1px solid silver;
-  height: 1px;
-  text-align: left;
-  margin-left: 0;
-  width: 20%;
-  min-width: 100px;
-}
-
-div.colist td {
-  padding-right: 0.5em;
-  padding-bottom: 0.3em;
-  vertical-align: top;
-}
-div.colist td img {
-  margin-top: 0.3em;
-}
-
-@media print {
-  #footer-badges { display: none; }
-}
-
-#toc {
-  margin-bottom: 2.5em;
-}
-
-#toctitle {
-  color: #527bbd;
-  font-size: 1.1em;
-  font-weight: bold;
-  margin-top: 1.0em;
-  margin-bottom: 0.1em;
-}
-
-div.toclevel1, div.toclevel2, div.toclevel3, div.toclevel4 {
-  margin-top: 0;
-  margin-bottom: 0;
-}
-div.toclevel2 {
-  margin-left: 2em;
-  font-size: 0.9em;
-}
-div.toclevel3 {
-  margin-left: 4em;
-  font-size: 0.9em;
-}
-div.toclevel4 {
-  margin-left: 6em;
-  font-size: 0.9em;
-}
-
-span.aqua { color: aqua; }
-span.black { color: black; }
-span.blue { color: blue; }
-span.fuchsia { color: fuchsia; }
-span.gray { color: gray; }
-span.green { color: green; }
-span.lime { color: lime; }
-span.maroon { color: maroon; }
-span.navy { color: navy; }
-span.olive { color: olive; }
-span.purple { color: purple; }
-span.red { color: red; }
-span.silver { color: silver; }
-span.teal { color: teal; }
-span.white { color: white; }
-span.yellow { color: yellow; }
-
-span.aqua-background { background: aqua; }
-span.black-background { background: black; }
-span.blue-background { background: blue; }
-span.fuchsia-background { background: fuchsia; }
-span.gray-background { background: gray; }
-span.green-background { background: green; }
-span.lime-background { background: lime; }
-span.maroon-background { background: maroon; }
-span.navy-background { background: navy; }
-span.olive-background { background: olive; }
-span.purple-background { background: purple; }
-span.red-background { background: red; }
-span.silver-background { background: silver; }
-span.teal-background { background: teal; }
-span.white-background { background: white; }
-span.yellow-background { background: yellow; }
-
-span.big { font-size: 2em; }
-span.small { font-size: 0.6em; }
-
-span.underline { text-decoration: underline; }
-span.overline { text-decoration: overline; }
-span.line-through { text-decoration: line-through; }
-
-
-/*
- * xhtml11 specific
- *
- * */
-
-tt {
-  font-family: monospace;
-  font-size: inherit;
-  color: navy;
-}
-
-div.tableblock {
-  margin-top: 1.0em;
-  margin-bottom: 1.5em;
-}
-div.tableblock > table {
-  border: 3px solid #527bbd;
-}
-thead, p.table.header {
-  font-weight: bold;
-  color: #527bbd;
-}
-p.table {
-  margin-top: 0;
-}
-/* Because the table frame attribute is overriden by CSS in most browsers. */
-div.tableblock > table[frame="void"] {
-  border-style: none;
-}
-div.tableblock > table[frame="hsides"] {
-  border-left-style: none;
-  border-right-style: none;
-}
-div.tableblock > table[frame="vsides"] {
-  border-top-style: none;
-  border-bottom-style: none;
-}
-
-
-/*
- * html5 specific
- *
- * */
-
-.monospaced {
-  font-family: monospace;
-  font-size: inherit;
-  color: navy;
-}
-
-table.tableblock {
-  margin-top: 1.0em;
-  margin-bottom: 1.5em;
-}
-thead, p.tableblock.header {
-  font-weight: bold;
-  color: #527bbd;
-}
-p.tableblock {
-  margin-top: 0;
-}
-table.tableblock {
-  border-width: 3px;
-  border-spacing: 0px;
-  border-style: solid;
-  border-color: #527bbd;
-  border-collapse: collapse;
-}
-th.tableblock, td.tableblock {
-  border-width: 1px;
-  padding: 4px;
-  border-style: solid;
-  border-color: #527bbd;
-}
-
-table.tableblock.frame-topbot {
-  border-left-style: hidden;
-  border-right-style: hidden;
-}
-table.tableblock.frame-sides {
-  border-top-style: hidden;
-  border-bottom-style: hidden;
-}
-table.tableblock.frame-none {
-  border-style: hidden;
-}
-
-th.tableblock.halign-left, td.tableblock.halign-left {
-  text-align: left;
-}
-th.tableblock.halign-center, td.tableblock.halign-center {
-  text-align: center;
-}
-th.tableblock.halign-right, td.tableblock.halign-right {
-  text-align: right;
-}
-
-th.tableblock.valign-top, td.tableblock.valign-top {
-  vertical-align: top;
-}
-th.tableblock.valign-middle, td.tableblock.valign-middle {
-  vertical-align: middle;
-}
-th.tableblock.valign-bottom, td.tableblock.valign-bottom {
-  vertical-align: bottom;
-}
-
-
-/*
- * manpage specific
- *
- * */
-
-body.manpage h1 {
-  padding-top: 0.5em;
-  padding-bottom: 0.5em;
-  border-top: 2px solid silver;
-  border-bottom: 2px solid silver;
-}
-body.manpage h2 {
-  border-style: none;
-}
-body.manpage div.sectionbody {
-  margin-left: 3em;
-}
-
-@media print {
-  body.manpage div#toc { display: none; }
-}
-</style>
-<script type="text/javascript">
-/*<![CDATA[*/
-var asciidoc = {  // Namespace.
-
-/////////////////////////////////////////////////////////////////////
-// Table Of Contents generator
-/////////////////////////////////////////////////////////////////////
-
-/* Author: Mihai Bazon, September 2002
- * http://students.infoiasi.ro/~mishoo
- *
- * Table Of Content generator
- * Version: 0.4
- *
- * Feel free to use this script under the terms of the GNU General Public
- * License, as long as you do not remove or alter this notice.
- */
-
- /* modified by Troy D. Hanson, September 2006. License: GPL */
- /* modified by Stuart Rackham, 2006, 2009. License: GPL */
-
-// toclevels = 1..4.
-toc: function (toclevels) {
-
-  function getText(el) {
-    var text = "";
-    for (var i = el.firstChild; i != null; i = i.nextSibling) {
-      if (i.nodeType == 3 /* Node.TEXT_NODE */) // IE doesn't speak constants.
-        text += i.data;
-      else if (i.firstChild != null)
-        text += getText(i);
-    }
-    return text;
-  }
-
-  function TocEntry(el, text, toclevel) {
-    this.element = el;
-    this.text = text;
-    this.toclevel = toclevel;
-  }
-
-  function tocEntries(el, toclevels) {
-    var result = new Array;
-    var re = new RegExp('[hH]([2-'+(toclevels+1)+'])');
-    // Function that scans the DOM tree for header elements (the DOM2
-    // nodeIterator API would be a better technique but not supported by all
-    // browsers).
-    var iterate = function (el) {
-      for (var i = el.firstChild; i != null; i = i.nextSibling) {
-        if (i.nodeType == 1 /* Node.ELEMENT_NODE */) {
-          var mo = re.exec(i.tagName);
-          if (mo && (i.getAttribute("class") || i.getAttribute("className")) != "float") {
-            result[result.length] = new TocEntry(i, getText(i), mo[1]-1);
-          }
-          iterate(i);
-        }
-      }
-    }
-    iterate(el);
-    return result;
-  }
-
-  var toc = document.getElementById("toc");
-  if (!toc) {
-    return;
-  }
-
-  // Delete existing TOC entries in case we're reloading the TOC.
-  var tocEntriesToRemove = [];
-  var i;
-  for (i = 0; i < toc.childNodes.length; i++) {
-    var entry = toc.childNodes[i];
-    if (entry.nodeName == 'div'
-     && entry.getAttribute("class")
-     && entry.getAttribute("class").match(/^toclevel/))
-      tocEntriesToRemove.push(entry);
-  }
-  for (i = 0; i < tocEntriesToRemove.length; i++) {
-    toc.removeChild(tocEntriesToRemove[i]);
-  }
-
-  // Rebuild TOC entries.
-  var entries = tocEntries(document.getElementById("content"), toclevels);
-  for (var i = 0; i < entries.length; ++i) {
-    var entry = entries[i];
-    if (entry.element.id == "")
-      entry.element.id = "_toc_" + i;
-    var a = document.createElement("a");
-    a.href = "#" + entry.element.id;
-    a.appendChild(document.createTextNode(entry.text));
-    var div = document.createElement("div");
-    div.appendChild(a);
-    div.className = "toclevel" + entry.toclevel;
-    toc.appendChild(div);
-  }
-  if (entries.length == 0)
-    toc.parentNode.removeChild(toc);
-},
-
-
-/////////////////////////////////////////////////////////////////////
-// Footnotes generator
-/////////////////////////////////////////////////////////////////////
-
-/* Based on footnote generation code from:
- * http://www.brandspankingnew.net/archive/2005/07/format_footnote.html
- */
-
-footnotes: function () {
-  // Delete existing footnote entries in case we're reloading the footnodes.
-  var i;
-  var noteholder = document.getElementById("footnotes");
-  if (!noteholder) {
-    return;
-  }
-  var entriesToRemove = [];
-  for (i = 0; i < noteholder.childNodes.length; i++) {
-    var entry = noteholder.childNodes[i];
-    if (entry.nodeName == 'div' && entry.getAttribute("class") == "footnote")
-      entriesToRemove.push(entry);
-  }
-  for (i = 0; i < entriesToRemove.length; i++) {
-    noteholder.removeChild(entriesToRemove[i]);
-  }
-
-  // Rebuild footnote entries.
-  var cont = document.getElementById("content");
-  var spans = cont.getElementsByTagName("span");
-  var refs = {};
-  var n = 0;
-  for (i=0; i<spans.length; i++) {
-    if (spans[i].className == "footnote") {
-      n++;
-      var note = spans[i].getAttribute("data-note");
-      if (!note) {
-        // Use [\s\S] in place of . so multi-line matches work.
-        // Because JavaScript has no s (dotall) regex flag.
-        note = spans[i].innerHTML.match(/\s*\[([\s\S]*)]\s*/)[1];
-        spans[i].innerHTML =
-          "[<a id='_footnoteref_" + n + "' href='#_footnote_" + n +
-          "' title='View footnote' class='footnote'>" + n + "</a>]";
-        spans[i].setAttribute("data-note", note);
-      }
-      noteholder.innerHTML +=
-        "<div class='footnote' id='_footnote_" + n + "'>" +
-        "<a href='#_footnoteref_" + n + "' title='Return to text'>" +
-        n + "</a>. " + note + "</div>";
-      var id =spans[i].getAttribute("id");
-      if (id != null) refs["#"+id] = n;
-    }
-  }
-  if (n == 0)
-    noteholder.parentNode.removeChild(noteholder);
-  else {
-    // Process footnoterefs.
-    for (i=0; i<spans.length; i++) {
-      if (spans[i].className == "footnoteref") {
-        var href = spans[i].getElementsByTagName("a")[0].getAttribute("href");
-        href = href.match(/#.*/)[0];  // Because IE return full URL.
-        n = refs[href];
-        spans[i].innerHTML =
-          "[<a href='#_footnote_" + n +
-          "' title='View footnote' class='footnote'>" + n + "</a>]";
-      }
-    }
-  }
-},
-
-install: function(toclevels) {
-  var timerId;
-
-  function reinstall() {
-    asciidoc.footnotes();
-    if (toclevels) {
-      asciidoc.toc(toclevels);
-    }
-  }
-
-  function reinstallAndRemoveTimer() {
-    clearInterval(timerId);
-    reinstall();
-  }
-
-  timerId = setInterval(reinstall, 500);
-  if (document.addEventListener)
-    document.addEventListener("DOMContentLoaded", reinstallAndRemoveTimer, false);
-  else
-    window.onload = reinstallAndRemoveTimer;
-}
-
-}
-asciidoc.install();
-/*]]>*/
-</script>
-</head>
-<body class="book">
-<div id="header">
-<h1>Introdução a Arquitetura de Computadores</h1>
-<span id="author">Alisson Vasconcelos de Brito</span><br />
-</div>
-<div id="content">
-<div class="sect1">
-<h2 id="prefacio">Prefácio</h2>
-<div class="sectionbody">
-<div class="paragraph"><p>texto</p></div>
-<div class="sect2">
-<h3 id="_público_alvo">Público alvo</h3>
-<div class="paragraph"><p>estudantes</p></div>
-</div>
-<div class="sect2">
-<h3 id="_método_de_elaboração">Método de Elaboração</h3>
-<div class="paragraph"><p>Financiamento da capes.</p></div>
-</div>
-<div class="sect2">
-<h3 id="_contribuição">Contribuição</h3>
-<div class="paragraph"><p>Erros e etc.</p></div>
-</div>
-</div>
-</div>
-<div class="sect1">
-<h2 id="_introdução">Introdução</h2>
-<div class="sectionbody">
-<div class="quoteblock">
-<div class="title">Objetivos do capítulo</div>
-<div class="content">
-<div class="paragraph"><p>Ao final deste capítulo você deverá ser capaz de:</p></div>
-<div class="ulist"><ul>
-<li>
-<p>
-Definir o que é a Arquitetura de Computadores e sua relevância
-</p>
-</li>
-<li>
-<p>
-Apresentar a Arquitetura Geral de um computador e suas principais
-operações
-</p>
-</li>
-<li>
-<p>
-Diferencias sistemas digitais de analógicos
-</p>
-</li>
-<li>
-<p>
-Apresentar o funcionamento de um transistor e sua relevância para
-a industria de dispositivos digitais
-</p>
-</li>
-<li>
-<p>
-Destacar a Lei de Moore e seu impacto para a evolução da
-industria de dispositivos eletrônicos digitais
-</p>
-</li>
-<li>
-<p>
-Identificar os principais fatos da evolução dos computadores
-</p>
-</li>
-</ul></div>
-</div>
-<div class="attribution">
-</div></div>
-<div class="paragraph"><p>Você sabe o que é Arquitetura de computadores? Você já se
-perguntou porque precisa estudar Arquitetura de Computadores? Esse
-capítulo nós vamos aprender que essa é uma das principais
-disciplinas da Ciência da Computação. Não só isso, foi a
-Arquitetura de Computadores que permitiu que a humanidade avançasse
-em todos os aspectos da ciência, saúde e tecnologia. Ao final desse
-capítulo, espero que você concorde comigo.</p></div>
-<div class="sect2">
-<h3 id="_o_que_é_a_arquitetura_de_um_computador">O que é a Arquitetura de um Computador?</h3>
-<div class="paragraph"><p>O termo arquitetura é principalmente utilizado na construção e
-decoração de edificações. Ele diz respeito à forma e a estrutura
-de uma construção. O termo refere-se à arte ou a técnica de
-projetar e edificar o ambiente habitado pelo ser humano. Na
-computação o termo foi adaptado para denominar a técnica (talvez
-até a arte também) de projetar e construir computadores. Nesse
-livro você não vai aprender a construir seu próprio computador.
-Para isso eu recomendo outros autores, John L. Hennessy, David A.
-Patterson e Andrew S. Tanenbaum. Esses autores produzem livros para
-engenheiros de computadores e acompanhá-los antes de se tornar um
-pode ser uma tarefa bastante árdua. Aqui você vai conhecer o
-computador por dentro e saber como ele funciona. Você não será
-capaz de construir um computador, mas saberá o suficiente para
-entender como os programas funcionam e até porque o computador para
-de funcionar as vezes, ou funciona lentamente, e que nessas
-situações, pressionar teclas do teclado rapidamente, ao mesmo tempo
-que move o mouse aleatoriamente, não faz o computador voltar a
-trabalhar novamente.</p></div>
-</div>
-<div class="sect2">
-<h3 id="_por_que_estudar_arquitetura_de_computadores">Por que estudar Arquitetura de Computadores?</h3>
-<div class="paragraph"><p>É essencial que todos profissionais da Computação tenham pelo
-menos conhecimentos básicos de Arquitetura de Computadores. Saber
-como o computador funciona nos permitirá entender sua capacidade (e
-incapacidade) de resolver problemas, sobre como programá-los da
-melhor forma possível, como deixar o computador e os dados contidos
-neles mais seguros, como ganhar desempenho e o que faz ele ficar tão
-lento às vezes a ponto de querermos destrui-lo.
-Então, estudar Arquitetura de Computadores é tão importante para
-um profissional de Computação, como estudar Anatomia é importante
-para um médico. Antes de iniciar qualquer estudo na Medicina, um
-médico precisa saber em detalhes o funcionamento do corpo humano.
-Quais são seus órgãos, como eles trabalham individualmente e como
-se relacionam para formar um sistema (digestivo, respiratório, motor
-etc.). Com a Arquitetura de Computadores é semelhante. Vamos
-aprender quais são os componentes de um computador, como eles
-funcionam e como eles trabalham em conjunto formando um sistema.
-Sem dúvidas o ser humano é a máquina mais perfeita já criada, mas
-vamos ver que o Computador é uma das máquinas mais incríveis que o
-homem já criou.</p></div>
-</div>
-<div class="sect2">
-<h3 id="_um_aluno_de_licenciatura_em_computação_precisa_estudar">Um aluno de Licenciatura em Computação precisa estudar</h3>
-<div class="paragraph"><p>Arquitetura de Computadores?</p></div>
-<div class="paragraph"><p>Ao longo de minha experiência como professor de Arquitetura de
-Computadores para alunos de Licenciatura em Computação, eu sempre
-ouvi essa pergunta. &#8220;Por que precisamos estudar Arquitetura de
-Computadores?&#8221;. Espero que isso já esteja claro para você. Mas se
-ainda não estiver, aqui vai uma outra razão. Você será um
-licenciado e vai trabalhar no ensino e aprendizagem da Ciência da
-Computação. Como ensinar alguém sobre essa ciência se você não
-souber em detalhes como um computador funciona? Isso seria como um
-professor de Farmácia que não conhece bem a Química, ou um
-professor de Matemática que não conhece os números.</p></div>
-</div>
-<div class="sect2">
-<h3 id="_arquitetura_geral">Arquitetura geral</h3>
-<div class="paragraph"><p>Hoje em dia há muitos tipos de computadores e diversas arquiteturas.
-Elas são frutos de muitos estudos, pesquisas e avanços
-tecnológicos. Mas todos computadores compartilham uma arquitetura
-comum. Essa arquitetura é o que separa um computador de uma
-calculadora de bolso, de um aparelho de televisão ou um relógio de
-pulso. Essa arquitetura é apresentada na <a href="#fig_arquitetura">[fig_arquitetura]</a>.</p></div>
-<div class="imageblock" id="fig_arquitetura">
-<div class="content">
-<img src="images/cap1/fig_arquitetura.eps" alt="images/cap1/fig_arquitetura.eps" />
-</div>
-<div class="title">Figura 1. Arquitetura básica de um computador</div>
-</div>
-<div class="paragraph"><p>Todo computador possui uma Unidade Central de Processamento, ou, do
-inglês, <strong>Central Processing Unit</strong> (CPU) e uma Memória Principal.
-Todos os dados a serem processados pela CPU, para operações
-lógicas e aritméticas, precisam estar na memória. Da memória os
-dados são transferidos para a CPU através de fios paralelos de
-comunicação, chamados de Barramento de Dados. Entretando, a CPU
-não toma decisões por si própria. Ela não sabe que dados deve
-trazer da memória, muito menos que operação executar com eles.
-Para isso, ela precisa que instruções, também armazenadas na
-memória, sejam trazidas para a CPU através do Barramento de
-Endereço. Cada instrução informa para a CPU que operação ela
-deve executar, com quais dados e o que ela deve fazer com o resultado
-da operação.</p></div>
-<div class="paragraph"><p>Para poder se localizar, a memória é organizada em endereços.
-Todos os dados e as instruções são localizadas através desses
-endereços. Cada instrução indica para a CPU que dados devem ser
-transferidos e processados através dos endereços desses dados. Esse
-endereço é transferido para a memória pela CPU através do
-Barramento de Endereço. A memória localiza o tal dado e o transfere
-para a CPU via Barramento de Dados. As instruções são
-desenvolvidas pelo programador, através de linguagens de
-programação. As ferramentas de compilação transformam os
-programas escritos em linguagens de alto nível, como C, Java e
-Phython, em instruções de máquina, que são finalmente copiadas
-para a memória no momento em que precisam ser executadas. Cada
-instrução é armazenada em um endereço diferente da memória. Na
-execução normal, a CPU passa para a memória, via Barramento de
-Endereço, o endereço da primeira instrução do programa, a
-memória transfere a instrução pelo Barramento de Instrução, a
-CPU a executa e, em seguida, solicita a instrução do endereço
-seguinte. Assim, os programas são executados sempre de forma
-sequencial, a não ser que uma instrução especial solicite que ela
-salte para uma instrução que não seja a consecutiva. Isso é o
-caso quando há instruções condicionais (como o &#8220;se&#8221; ou
-<tt>if</tt>), instruções de repetição (como <tt>while</tt> e o <tt>for</tt>),
-ou chamadas a sub-programas, ou mesmo, por ordem do Sistema
-Operacional, para que o programa pare de executar para que um outro
-tome seu lugar.</p></div>
-<div class="paragraph"><p>As memórias são, quase sempre, muito mais lentas do que as CPUs.
-Isso exigiu, ao longo dos anos, que as CPUs possuíssem também uma
-porção interna de memória muito rápida, chamada Memória Cache. A
-tecnologia que permite essas memórias serem mais rápidas, tornam-as
-também muito caras. Por isso que sua capacidade geralmente é muito
-limitada. Para acelerar ainda mais, elas são instaladas dentro das
-CPUs. Todos os dados e instruções transferidos da Memória
-Principal para a CPU são salvos também na Cache. Como a Cache não
-é capaz de guardar todos os dados da Memória Principal, apenas os
-dados mais recentes transferidos para a CPU permanecem na Cache.
-Técnicas muito avançadas são aplicadas para que se consiga, no
-máximo possível, manter os dados mais importantes daquele instante
-na Memória Cache.</p></div>
-<div class="paragraph"><p>A CPU também é responsável por enviar sinais de controle aos
-outros dispositivos do computador, como periféricos, dispositivos de
-entrada e saída, e memórias externas. Esse sinais são enviados
-quando uma instrução dá ordem para tal. Por exemplo, quando uma
-instrução pede que uma mensagem sem impressa na tela, a CPU, ao
-receber e executar essa instrução, envia para o controle do monitor
-que imprima na tela a mensagem contida o endereço que também foi
-passada pela instrução.</p></div>
-<div class="paragraph"><p>É esse comportamento que diferencia um computador de outros
-dispositivos eletrônicos mais simples. A essência da CPU não é
-muito diferente de uma calculadora de bolso. Ela executa operações
-lógicas e aritméticas. Entretanto, no projeto do computador, o
-papel do homem foi substituído pela programação. Todas
-instruções das tarefas que a CPU precisa executar são armazenadas
-na memória e, a partir de então, a CPU pode trabalhar sem qualquer
-interferência externa. Com a programação, a CPU pode também
-executar tarefas diversas, desde simulações, jogos, tocar músicas
-e vídeos etc. Simplificando, o computador é uma máquina
-programável e de propósito geral.</p></div>
-<div class="sect3">
-<h4 id="_operações_básicas">Operações básicas</h4>
-<div class="paragraph"><p>Todos computadores executam três operações básicas:</p></div>
-<div class="ulist"><ul>
-<li>
-<p>
-Movimentação de dados
-</p>
-</li>
-<li>
-<p>
-Processamentos de dados
-</p>
-</li>
-<li>
-<p>
-Armazenamento de dados
-</p>
-</li>
-</ul></div>
-<div class="paragraph"><p>A movimentação de dados é a transferência de um dado de um ponto
-para outro do computador. Pode ser de um endereço de memória para
-outro, de um dispositivo de entrada para a memória, ou da memória
-para um dispositivo de saída. O processamento de dados ocorre quando
-a CPU recebe um determinado dado e executa uma operação que o
-modifica de alguma forma. Já as operações de armazenamento ocorre
-quando a CPU precisa registrar um dado em algum local específico,
-como salvar um dado no disco rígido, ou num pendrive, ou mesmo na
-Memória Principal.</p></div>
-</div>
-</div>
-<div class="sect2">
-<h3 id="_sistemas_analógicos_x_sistemas_digitais">Sistemas Analógicos x Sistemas Digitais</h3>
-<div class="paragraph"><p>Para sabermos a importância de um computador e sua forma de
-funcionamento, precisamos conhecer suas potencialidades e suas
-limitações. O computador é um dispositivo eletrônico digital.
-Isso significa que ele armazena, processa e gera dados na forma
-digital. Por outro lado, o computador não é capaz de processar
-dados analógicos. Eles antes precisam ser convertidos para digital
-para poderem ser utilizados por computadores. Mas o que venha a ser
-um dado analógico? Qualquer informação presente na natureza, como
-uma imagem, um som ou um cheiro, pode ser analisada em no mínimo
-duas componentes. Uma seria a sua intensidade e outra o tempo. A
-<a href="#fig_analog_digital">[fig_analog_digital]</a> a seguir apresenta essa representação, onde
-o sinal em forma de onda cinza (sinal digital) seria a
-representação de um sinal analógico.</p></div>
-<div class="imageblock" id="fig_analog_digital">
-<div class="content">
-<img src="images/cap1/analogico_digital.eps" alt="images/cap1/analogico_digital.eps" />
-</div>
-<div class="title">Figura 2. Sinal Analógico versus Sinal Digital</div>
-</div>
-<div class="paragraph"><p>Um som, por exemplo, é formado por vibrações no ar de diferentes
-intensidades (amplitudes) ao longo do tempo. Cada amplitude vai soar
-para nossos ouvidos como um tom diferente e alguns são até
-imperceptíveis aos nossos ouvidos. Por outro lado, como o computador
-é um dispositivo baseado em números, para que ele armazene um som
-em sua memória e possa fazer qualquer processamento sobre ele
-(gravar, transmitir, mixar), ele deve antes representá-lo na forma
-de números. Ai que está a dificuldade. As intensidades possíveis
-de um som são tantas que se aproximariam do infinito. Para tornar
-essa grandeza mais clara, imagine que pudéssemos emitir a
-intensidade do som emitido por um pássaro. Se em terminado momento
-dissermos que essa intensidade tem valor 5. Logo em seguida um outro
-som é emitido, medidos e constatamos que sua intensidade é 4. Até
-aí tudo bem! Mas o pássaro poderá em seguida emitir diversos sons
-que estariam entre 4 e 5, como 4,23, ou 4,88938, ou até uma dízima
-periódica, como 4,6666… Um ser humano, mesmo que não consiga
-medir a intensidade do canto do pássaro, consegue ouvi-lo,
-apreciá-lo e até repeti-lo com uma certa proximidade com alguns
-assobios. Mas o computador não trabalha assim! Antes de tudo, um
-computador teria que discretizar esses valores medidos, ou seja,
-passá-los do domínio dos números reais para o domínio dos
-inteiros. Assim, o que era 4 permanece 4, o que era 5, continua como
-5, mas o que foi medido como 4,23 é convertido para 4, e o que era
-4,88938 e 4,666 são convertidos para 5. Dessa forma, o computador
-passa a tratar com números reais e finitos. Um canto de um pássaro
-(ou até de uma orquestra sinfônica) pode ser armazenado e
-processador pelo computador. Na <a href="#fig_analog_digital">[fig_analog_digital]</a> apresentada, a
-onda quadrada representa um sinal digital.</p></div>
-<div class="paragraph"><p>Mas perceba que o som emitido pelo pássaro teve que ser modificado.
-Ele antes era complexo, rico e cheio de detalhes. Agora se tornou
-algo mais simples e reduzido. Houve uma perda de informação ao
-passarmos o dado do analógico para o digital. Processo semelhante
-ocorre quando outras informações da natureza são passadas para o
-computador, como uma imagem através de uma foto, ou uma cena
-através de um vídeo. Parte da informação deve ser ignorada para
-que possa ser armazenada em computadores. Você deve estar se
-perguntando então, quer dizer que imagens e sons analógicos possuem
-mais qualidade do que digitais? A resposta rigorosa para essa
-pergunta é, sim! Mas uma resposta mais consciente seria, as vezes!
-Isso porque a perda causada pela digitalização pode ser reduzida
-até níveis altíssimos que modo que nem o ouvido, nem a visão
-humana serão capazes de perceber.</p></div>
-<div class="paragraph"><p>Como exemplo de dados analógicos podemos citar tudo o que vem da
-natureza, som, imagem, tato, cheiro, enquanto que digitais são todos
-aqueles armazenados por dispositivos eletrônicos digitais, como
-computadores, celulares e TVs (exceto as antigas analógicas). Se uma
-foto digital, por exemplo, possui menos qualidade do que uma
-analógica, por que todos procuram apenas máquinas fotográficas
-digitais, transformando as analógicas quase em peças de museu? A
-resposta está na praticidade. Os computadores só entendem
-informações digitais. Uma máquina fotográfica, mesmo com
-qualidade inferior, vai nos permitir passar as fotos para o
-computador, compartilhar com os amigos, aplicar edições e
-melhorias, ampliar e copiar quantas vezes quisermos. Tarefas que
-antes eram impossíveis com máquinas analógicas. O mesmo pode ser
-refletido para músicas, documentos e livros. O mundo hoje é
-digital, e não há como fugirmos disso!</p></div>
-</div>
-<div class="sect2">
-<h3 id="_o_transistor">O Transistor</h3>
-<div class="paragraph"><p>O transistor é um componente eletrônico criado na década de 1950.
-Ele é o responsável pela revolução da eletrônica na década de
-1960. Através dele foi possível desenvolver sistemas digitais
-extremamente pequenos. Todas funcionalidades de um computador são
-internamente executadas pela composição de milhões de
-transistores. Desde operações lógicas e aritméticas, até o
-armazenamento de dados em memórias (a exceção do disco rígido,
-CD, DVD e fitas magnéticas), tudo é feito pelos transistores.</p></div>
-<div class="paragraph"><p>Os primeiros eram fabricados na escala de micrômetros 10<sup>-6</sup>
-metros). Daí surgiram os termos microeletrônica e micro-tecnologia.
-Depois disso deu-se início a uma corrida tecnológica para se
-desenvolver transistores cada vez mais rápidos, menores e mais
-baratos. Essa revolução dura até hoje, mas foi mais forte nas
-décadas de 1980 e 1990. Foi emocionante acompanhar a disputa entre
-as empresas norte-americadas Intel e AMD para dominar o mercado de
-computadores pessoais. A cada 6 meses um novo processador era
-lançado por um delas, tomando da concorrente a posição de
-processador mais rápido do mercado. Poucos eram aqueles consumidores
-que conseguiam se manter a atualizados com tantos lançamentos.</p></div>
-<div class="paragraph"><p>O princípio básico é utilizar a eletrônica (corrente elétrica,
-resistência e tensão) para representar dados e depois poder
-executar operações com eles. A forma mais fácil de fazer isso foi
-primeiramente limitar os dados a apenas dois tipos. Zero e um. O
-sistema de numeração binário é muito mais fácil de representar
-com dispositivos eletrônicos do que o decimal, por exemplo. O
-transistor possui dois estados. Ou ele está carregado, ou está
-descarregado, assim como uma pilha. Isso facilmente pode ser mapeado
-para o bit 1 (carregado) e o bit (0). O revolucionário, diferente de
-uma pilha, foi possibilitar que esse estado pudesse ser mudado
-eletronicamente a qualquer momento e de forma muito rápida.</p></div>
-<div class="paragraph"><p>Assim, com 8 transistores em paralelo, eu posso representar, por
-exemplo um número de 8 bits. Posso mudar seus valores mudando suas
-cargas, e posso ler seus valores chegando se cada um possui, ou não
-carga. Esse é o princípio básico de construção de uma memória.</p></div>
-<div class="paragraph"><p>De forma semelhante, é possível integrar transistores para que os
-mesmos executem operações lógicas e aritméticas. As portas
-lógicas estudadas por você em Introdução à Computação são
-todas fabricadas utilizando transistores.</p></div>
-<div class="paragraph"><p>Quanto menores são os transistores, mais dados podem ser armazenados
-por área. Ao mesmo tempo, transistores menores guardam menos carga.
-Isso torna mais rápido o processo de carregamento e descarregamento,
-que, por consequência, torna o processamento e armazenamento de
-dados muito mais rápidos também.</p></div>
-<div class="paragraph"><p>Com a evolução da nanoeletrônica, os transistores são tão
-pequenos que possibilitou a construção de memórias de 1GB (um giga
-byte) do tamanho da unha da mão de um adulto. Para ser ter uma
-ideia, 1 Giga é a abreviação de 10<sup>9</sup>, ou seja, um bilhão. Um
-byte são 8 bits. Então, uma memória de 1GB possui, pelo menos, 8
-bilhões de transistores. Os processadores também se tornaram
-bastante velozes com a miniaturização dos transistores. Os
-processadores atuais trabalham na frequência de GHz (Giga Hertz), ou
-seja, na casa de bilhões de ciclos por segundo (diferente de
-operações por segundo). Isso é muito rápido!</p></div>
-<div class="imageblock" id="fig_mosfet">
-<div class="content">
-<img src="images/cap1/transistor.eps" alt="images/cap1/transistor.eps" />
-</div>
-<div class="title">Figura 3. Estrutura de um transistor tipo MOSFET</div>
-</div>
-<div class="paragraph"><p>Na <a href="#fig_mosfet">[fig_mosfet]</a> anterior é apresentada a estrutura de um
-transistor MOSFET. Esse transistor é o mais utilizado para se
-construir sistemas eletrônicos digitais, como os computadores. O
-nome vem da abreviação de &#8220;Metal-Oxide Semiconductor Field-Effect
-Transistor&#8221;. Vamos ver o que significa cada palavra dessas, e isso
-nos ajudará a conhecer um pouco mais o MOSFET e sua relevância. O
-termo MOS (&#8220;Metal-Oxide Semiconductor&#8221;) vem dos materiais
-utilizados para compor um MOSFET, que são principalmente, óxido
-metálico e semicondutor.</p></div>
-<div class="paragraph"><p>Semicondutores são materiais que possuem propriedades que nem os
-permitem classificar como condutor, nem como isolante. Em algumas
-condições ele age como um isolante, e em outras, como um condutor.
-O semicondutor mais utilizado em transistores é o silício (símbolo
-Si na Tabela Periódica). Em condições ambientes, o silício age
-como um isolante, mas se misturado a outros materiais, ele pode se
-tornar um condutor até a intensidade desejada.</p></div>
-<div class="admonitionblock">
-<table><tr>
-<td class="icon">
-<div class="title">Nota</div>
-</td>
-<td class="content">O Silício se tornou tão importante que modificou toda uma região
-da Califórnia nos Estados Unidos na década de 1950, tornando-a uma
-das mais promissoras do mundo até hoje. Essa região abrigou e
-abriga as mais importantes empresas do ramo de projeto de
-computadores, como Intel, AMD, Dell, IBM e Apple, e depois de
-softwares que iriam executar nesses computadores, como Microsoft,
-Oracle e Google. Essa região é chamada de Vale do Silício.</td>
-</tr></table>
-</div>
-<div class="paragraph"><p>No transistor da <a href="#fig_mosfet">[fig_mosfet]</a> a cor verde representa um cristal de
-silício que foi dopado com cargas negativas. Já a cor vermelha,
-representa a parte que foi dopada com cargas positivas. Na situação
-normal uma corrente elétrica aplicada no Dreno (Drain) consegue
-produz percorrer o estreito canal negativo e seguir até a Fonte
-(Source). Nessa condição dizemos que o transistor está ativo.
-Porém, for aplicada uma tensão negativa na Porta (Gate), as cargas
-positivas da região P (em vermelho) serão atraídas para mais
-próximo da Porta, e isso irá fechar o canal por onde passava a
-corrente elétrica. Nesse caso, dizemos que o transistor está
-inativo.</p></div>
-<div class="paragraph"><p>Por que isso tudo nos interessa? Quando o transistor está ativo, ele
-pode ser visto com o valor 1, e quando inativo, ele pode ser visto
-com o valor 0. Assim, temos a menor memória possível de ser
-construída. Quando quisermos que ela guarde o valor 1, basta
-desligar a tensão da Porta e aplicar uma corrente no Dreno. Já
-quando quisermos que ele armazene o valor 0, precisamos aplicar uma
-corrente na Porta e fechar o canal. Então, a memória de 8 bilhões
-de bits, pode ser elaborada com 8 bilhões de transistores como esses.</p></div>
-<div class="paragraph"><p>Agora conhecemos o primeiro aspecto que faz dos transistores
-essenciais para o entendimento do computador. Eles são usados para a
-construção de memórias. Memórias feitas a base de transistores
-são chamadas também de Memórias de Estado Sólido. Mas há outras,
-não tão eficientes e miniaturizadas, como memórias ópticas e
-magnéticas. O importante percebermos é que quanto menores pudermos
-construir esses transistores, melhor. O processo de abertura e
-fechamento do canal não é instantâneo. Ele leva um curtíssimo
-tempo, mas quando somados os tempos de todos os bilhões de
-transistores, ele passa a se tornar relevante. Quanto menor ele for,
-mais estreito é o canal e, portanto, mais rápido ele liga e
-desliga, da mesma forma, menor será a distância entre o Dreno e a
-Fonte, levando também menos tempo para os elétrons deixarem o Dreno
-em direção à fonte. Isso tudo fará a memória mais rápida.
-Transistores pequenos também possibilitam que mais dados sejam
-armazenados por área. É por isso que hoje enormes capacidades de
-armazenamento são disponíveis em dispositivos tão reduzidos, como
-são os exemplos de pen-drives e cartões de memória.</p></div>
-<div class="paragraph"><p>Os transistores também são usados para executar operações
-lógicas e aritméticas. A carga retirada de um transistor pode
-servir para alimentar um outro e que, se combinados de forma correta,
-podem executar as operações lógicas básicas, E, OU, NÃO e as
-aritméticas, adição, subtração, divisão e multiplicação. Com
-isso, os transistores não apenas podem ser utilizados para armazenar
-dados, mas como executar operações lógicas e aritméticas sobre
-esses dados. Isso é fantástico e vem revolucionado todo o mundo.
-Não só na Ciência da Computação, mas como também em todas
-áreas do conhecimento. O que seria da humanidade hoje sem o
-computador? Sem o telefone celular? Sem os satélites?</p></div>
-</div>
-<div class="sect2">
-<h3 id="_a_lei_de_moore">A Lei de Moore</h3>
-<div class="paragraph"><p>Durante os anos de 1950 e 1965, a industrias do Vale do Silício
-disputavam pelo domínio do recém-surgido mercado da computação e
-eletrônica. Naquela época ainda não havia surgido o termo TIC
-(Tecnologia da Informação e Comunicação), mas ele seria mais
-apropriado para definir o nicho de clientes e serviços que eles
-disputavam. Eles dominavam a produção de circuitos eletrônicos
-digitais, dominados pela Intel e AMD, a produção de computadores e
-equipamentos de comunicação, como a Dell, Apple, IBM, HP e CISCO,
-além da indústria e software e serviços, como a Apple, Microsoft
-e, mais tarde, a Google. A disputa era grande e nem sempre leal.</p></div>
-<div class="admonitionblock">
-<table><tr>
-<td class="icon">
-<div class="title">Nota</div>
-</td>
-<td class="content">Assista ao filme &#8220;Piratas do Vale do Silício&#8221; (1999) e tenha uma
-ideia de como essa guerra estava longe de ser limpa.</td>
-</tr></table>
-</div>
-<div class="paragraph"><p>Entretanto, não se sabia naquela época onde essa disputa ia parar,
-nem quem seriam os vencedores, nem mesmo, se haveria sequer
-vencedores. Até um dos sócios e presidente da Intel, Gordon Moore,
-lançou um trabalho minucioso onde ele destacava a experiência que
-ele adquiriu ao longe de alguns anos trabalhando na indústria de
-fabricação de processadores e circuitos para computadores. Ele
-percebeu que, sempre a indústria avançava em sua tecnologia e
-conseguia reduzir o tamanho de cada transistor de um circuito
-integrado, os computadores tornavam-se também muito mais velozes do
-que antes. Porém, essa redução no tamanho dos transistores requer
-uma total atualização nos equipamentos da indústria, tornando os
-equipamentos anteriores obsoletos. Assim, só seria viável a
-evolução para transistores menores se o lucro da empresa fosse o
-suficiente para pagar todas essas despesas. Por outro lado, ele
-também percebeu que os computadores e equipamentos mais obsoletos
-ainda possuíam mercado aberto em países menos desenvolvidos
-economicamente. Ele concluiu então que a indústria seria sim capaz
-de continuar evoluindo na redução do tamanho dos transistores
-porque os novos computadores, sendo tornando mais velozes, seriam
-tão mais eficientes e atrativos, que todos os clientes,
-principalmente as empresas, fariam de tudo para trocar seus
-computadores antigos por novos, afim de se tornarem cada vez mais
-produtivos.</p></div>
-<div class="paragraph"><p>Além dessa análise de mercado, ele analisou como o processo
-industrial era concebido e como os novos computadores se
-beneficiariam da redução do tamanho dos transistores. Ao final, ele
-afirmou que “A cada ano a quantidade de transistores por chip irá
-dobrar de tamanho, sem alteração em seu preço”. Essa frase pode
-ser interpretada também pelas consequências da quantidade de
-transistores por chip. Ou seja, a cada ano, com o dobro dos
-transistores, os chips se tornarão duas vezes mais rápidos. Um
-exemplo mais comum de chip são os processadores dos computadores.
-Então, por consequência, os computadores irão dobrar sua
-velocidade de processamento a cada ano, e ainda vão permanecer com o
-mesmo preço.</p></div>
-<div class="paragraph"><p>Naquela época essa era uma afirmação muito forte e ambiciosa.
-Muitos receberam esse estudo com cautela. Mas não demorou muito para
-todos perceberem que as previsões de Moore estavam se realizando.
-Foi tanto, e o trabalho dele foi depois chamado de “Lei de Moore”
-e ela ainda é válida até os dias de hoje. Na <a href="#fig_moore">[fig_moore]</a> a
-seguir é possível perceber como a quantidade de transistores por
-processadores cresceu dos anos 1970 até por volta de 2003 (linha
-contínua). É possível ver que ela não se afastou muito das
-previsões de Moore (linha tracejada).</p></div>
-<div class="imageblock" id="fig_moore">
-<div class="content">
-<img src="images/cap1/lei_moore.eps" alt="images/cap1/lei_moore.eps" />
-</div>
-<div class="title">Figura 4. Evolução do número de transistores nos processadores em comparação com a Lei de Moore</div>
-</div>
-<div class="paragraph"><p>A Lei de Moore se tornou tão importante que ela não é usada apenas
-como uma meta a ser buscada e batida a cada ano, mas também como um
-meio para se verificar se a indústria está evoluindo na velocidade
-esperada. Apesar de Moore está muito correto em suas previsões,
-todos sabem, inclusive ele próprio, que esse crescimento não vai
-durar para sempre. Os transistores hoje estão na escala de 25
-nanometros. Essa é a mesma escala de alguns vírus e bactérias.
-Reduzir mais do que isso está se tornando cada vez mais difícil.
-Pesquisadores e cientistas buscam outras formas de fazer com que os
-computadores continuem evoluindo em sua velocidade e reduzindo seu
-tamanho. Alguns pensam na substituição de transistores de Silício
-por outros materiais, como Grafeno. Outros até são mais radicais e
-defendem que a forma de computação deve mudar, talvez através de
-Computadores Quânticos ou de Bio-Computadores.</p></div>
-<div class="paragraph"><p>Quanto menores forem os transistores, mais rapidamente eles podem ser
-carregados e descarregados. Isso possibilita que o sistema trabalhe
-cada vez mais veloz. Mas há ainda outra limitação para a redução
-do tamanho dos transistores é a dissipação de calor. Quanto
-menores os transistores, mais deles são adicionados num mesmo
-circuito. O funcionamento dos transistores, como dito anteriormente,
-é feito através da passagem de corrente elétrica (elétrons em
-movimento). Como toda máquina elétrica, nem toda corrente é
-aproveitada. Muito dela é desperdiçada através da dissipação de
-calor. Então, uma vez que há milhões desses transistores
-trabalhando juntos, a dissipação de calor é ainda maior.</p></div>
-<div class="paragraph"><p>É muito importante para toda a humanidade que os computadores
-continuem evoluindo. A redução do tamanho dos computadores, aliada
-ao aumento de desempenho e sem o crescimento dos preços, permitiu
-que todas as ciência evoluíssem ao mesmo tempo, com a mesma
-velocidade. A metereologia, a medicina, as engenharias e até as
-Ciências Humanas avançaram sempre em conjunto com o avanço da
-computação. Para se ter um exemplo, foi a evolução dos
-transistores que permitiu que computadores se comunicassem numa
-velocidade tão grande que permitiu a formação da rede mundial de
-computadores, a Internet. Qualquer pessoa hoje consegue em poucos
-milissegundos fazer uma pesquisa por informações que estão do
-outro lado do planeta. Algo que antes só era possível viajando até
-bibliotecas distantes e cheirando bastante mofo e poeira. Hoje, ter
-em casa bilhões de bytes (Giga bytes) armazenados num minúsculo
-cartão de memória, é algo corriqueiro. A informação está hoje
-disponível numa escala tão grande e numa velocidade tão intensa
-que parece que mais nada é impossível para a humanidade. Após a
-Revolução Industrial do século XVIII que substitui os
-trabalhadores braçais por máquinas, o século XX, puxado pela
-evolução dos transistores, passou pelo o que muitos consideram a
-Revolução da Informação e o século XXI, já é considerado a
-“Era do Conhecimento”.</p></div>
-</div>
-<div class="sect2">
-<h3 id="_a_evolução_dos_computadores">A evolução dos computadores</h3>
-<div class="sect3">
-<h4 id="_o_eniac">O ENIAC</h4>
-<div class="paragraph"><p>O primeiro computador criado foi o ENIAC (‘Electronic Numerical
-Integrator And Computer’), desenvolvido por Eckert e Mauchly na
-Universidade da Pennsylvania, Estados Unidos. O projeto iniciou em
-1943 financiado pelo governo americano. O período era da Segunda
-Guerra Mundial e o objetivo era poder calcular de forma mais ágil as
-melhores trajetórias para transporte de armas e mantimentos em meio
-aos exércitos inimigos. Esse é o tipo de cálculo que pequenos
-aparelhos celulares fazem hoje para encontrar rotas nas cidades
-através de GPS (‘Global Positioning System’) e análise de mapa.
-O projeto só foi concluído em 1946, tarde demais para ser utilizado
-para a Segunda Guerra, mas foi bastante utilizado até 1955.</p></div>
-<div class="paragraph"><p>O ENIAC ocupava uma área de 4500 metros quadrados, pesava 30
-toneladas e consumia cerca de 140KW. Ele era capaz calcular 5000
-somas por segundo. A programação era feita manualmente através da
-manipulação de chaves, ou seja, não havia linguagem de
-programação, nem compiladores ou interpretadores de comandos. O
-Sistema Operacional só surgiu bem depois e tomou o emprego de muitos
-funcionários chamados na época de operadores de computadores.
-Profissão hoje extinta! O ENIAC ainda não utilizada transistores,
-mas válvulas que, dependendo de seu nível de carga, representavam
-um número. Cada válvula precisava estar devidamente aquecida para
-funcionar corretamente, então o processo de ligar o ENIAC era
-trabalhoso e levava bastante tempo. Ele trabalhava com o sistema de
-numeração decimal, o que parecia óbvio naquela época, mas que
-depois dos transistores, se tornaram complexo demais e foi adotado o
-sistema binário.</p></div>
-<div class="paragraph"><p>Após a Segunda Guerra iniciou-se o período chamado de Guerra Fria,
-quando a espionagem, sabotagem e muito especulação reinava entre os
-países liderados pela União Sovitética e Estados Unidos. Prato
-cheio para os computadores. Possuir um computador que fosse capaz de
-decifrar mensagens codificadas dos inimigos era o sonho de consumo de
-todo general daquela época.</p></div>
-</div>
-<div class="sect3">
-<h4 id="_a_arquitetura_de_von_neumann">A Arquitetura de von Neumann</h4>
-<div class="paragraph"><p>Muitas empresas e governos corriam para construir seu próprio
-computador que fosse mais avançado do que os anteriores. Muitos
-projetos surgiram depois do ENIAC. Mas todos eles eram barrados por
-algumas dificuldades e limitações. Como por exemplo, o fato de não
-serem programados e trabalharem com números decimais. O problema de
-trabalhar com decimais é que cada algarismo armazenado possui 10
-estados possíveis, representando os números de 0 a 9. Dentro de um
-sistema eletrônico, isso é complicado por que a carga de cada
-dispositivo, seja transistor, seja válvula, deveria ser medida para
-verificar se que número ela estava representando. Os erros eram
-muito frequentes. Bastava que uma válvula estivesse fora da
-temperatura ideal para que os resultados das operações começassem
-a sair errado.  Von Neumann recomendou em sua arquitetura que os
-dados e instruções fossem agora armazenados em binário,
-facilitando a análise dos mesmos e reduzindo a quantidade de erros.</p></div>
-<div class="paragraph"><p>Em 1952, o professor John von Neumann, da Univeridade de Princeton,
-Estados Unidos, apresentou um projeto inusitado para a arquitetura de
-um computador. Ele sugeriu que o computador fosse organizado em
-componentes, cada um executando apenas uma única tarefa e de forma
-muito mais organizada. Ele propôs que o computador fosse composto
-por (ver <a href="#fig_neumann">[fig_neumann]</a>):</p></div>
-<div class="ulist"><ul>
-<li>
-<p>
-Memória Principal: responsável por armazenar os programas a serem
-executados, assim como os dados a serem processados
-</p>
-</li>
-<li>
-<p>
-Unidade Lógica e Aritmética (ULA): para realização das
-operações lógicas e aritméticas
-</p>
-</li>
-<li>
-<p>
-Unidade de Controle: que, baseado nas instruções lidas da
-memória, enviaria sinais de controle para a ULA para que a mesma
-executasse as operações devidas
-</p>
-</li>
-<li>
-<p>
-Unidade Central de Processamento (CPU): que agruparia a ULA e a
-Unidade de Controle
-</p>
-</li>
-<li>
-<p>
-Unidade de Entrada e Saída: responsável pela comunicação com os
-periféricos do computador (teclado, monitor, memória externa etc.)
-</p>
-</li>
-</ul></div>
-<div class="imageblock" id="fig_neumann">
-<div class="content">
-<img src="images/cap1/arquitetura_von_neumann.eps" alt="images/cap1/arquitetura_von_neumann.eps" />
-</div>
-<div class="title">Figura 5. Estrutura da Máquina de von Neumann</div>
-</div>
-<div class="paragraph"><p>A Arquitetura de von Neumann deu tão certo que todos os fabricantes
-começaram a segui-la. Os computadores utilizados até hoje em dia
-seguem os preceitos básicos propostos por ele. Muitos avanços
-surgiram, melhorias foram feitas, mas até hoje os computadores são
-formados por Unidades de Controle, CPU, ULA, memória e Unidades de
-Entrada e Saída. John von Neumann deixou um legado para toda a
-humanidade.</p></div>
-</div>
-<div class="sect3">
-<h4 id="_a_ibm">A IBM</h4>
-<div class="paragraph"><p>A International Business Machines, ou apenas IBM, foi fundada em 1911
-com o nome de Computing Tabulating Recording (CTR) e iniciou
-produzindo e comercializando calculadoras para empresas e
-empresários. Só em 1924 é que ela muda de nome para International
-Business Machines ou apenas IBM. Ela é uma das poucas empresas que
-sobreviveram a todos os avanços da computação e continua sendo uma
-potência mundial. Apenas em 1953 a IBM entra no mercado de
-computadores com o IBM 701, tendo sempre as grande organizações
-como alvos. Só muitos anos depois é que os computadores pessoais
-foram surgir. O IBM 701 trabalhava com cartões perfurados, ou seja,
-toda programação dele era feita através de uma perfuradora que
-marca buracos para representar o bit 1, e deixava ilesa uma área
-para representar o 0. O mesmo acontecia depois que os programas era
-lidos e processados. Uma folha de papel era perfurada pelo computador
-para representar o resultados das operações executadas. Não
-preciso nem dizer o que isso era trabalhoso!</p></div>
-<div class="paragraph"><p>Em 1955 a IBM lança o IBM 702 que agora não fazia apenas cálculos
-científicos, mas também aplicações comerciais, visando deixar de
-ser um equipamento apenas para cientistas, mas também para
-empresários. Depois desses vários outros computadores foram
-lançados nas séries 700. Essas máquinas ainda utilizavam válvulas
-para armazenar os dados. Só em 1957 é que surge a Segunda Geração
-de computadores, com a utilização de transistores. Isso tornou os
-computadores mais leves, baratos, velozes e mais energicamente
-eficientes. Os primeiros computadores dessa geração foram o IBM
-7000 e o PDP-1, da DEC, empresa que não existem mais.</p></div>
-<div class="paragraph"><p>A IBM lança em 1964 o IBM série 360, substituindo os antigos
-computadores da série 7000. O IBM 360 inicia a primeira família de
-planejada de computadores. Isso significava que todos computadores
-seguintes da série 360 seriam compatíveis com os anteriores. Todos
-programas desenvolvidos ou adquiridos pelas empresas poderiam ser
-usados mesmo que a empresa substituísse os computadores pela
-geração mais nova. Isso tornou a IBM uma das empresas mais
-poderosas do mundo na época, com filiais e representantes em todos o
-continentes do planeta.</p></div>
-</div>
-<div class="sect3">
-<h4 id="_as_gerações_dos_computadores">As gerações dos computadores</h4>
-<div class="paragraph"><p>As gerações de computadores surgiram com a miniaturização dos
-transistores e sua integração em chips em escalas cada vez maiores.
-Podemos então ver as gerações dos computadores como:</p></div>
-<div class="ulist"><ul>
-<li>
-<p>
-1946 a 1957: computadores baseados em tubos de vácuo
-</p>
-</li>
-<li>
-<p>
-1958 a 1964: surgimento dos transistores
-</p>
-</li>
-<li>
-<p>
-1965: indústrias atingiram a integração de até 100 transistores
-num único chip
-</p>
-</li>
-<li>
-<p>
-1971: chamada de Integração em Média Escala, com até 3000
-transistores por chip
-</p>
-</li>
-<li>
-<p>
-1971 a 1977: Integração em Larga Escala, com até 100.000
-transistores por chip
-</p>
-</li>
-<li>
-<p>
-1978 a 1991: Integração em Escala Muito Grande (VLSI), com até
-100 milhões de transistores por chip
-</p>
-</li>
-<li>
-<p>
-1991 até a atualidade: Integração Ultra-VLSI, com mais de 100
-milhões de transistores por chip
-</p>
-</li>
-</ul></div>
-</div>
-<div class="sect3">
-<h4 id="_memórias_de_semicondutores">Memórias de semicondutores</h4>
-<div class="paragraph"><p>Em 1970, uma empresa chamada Fairchild desenvolveu pela primeira vez
-uma memória utilizando a mesma tecnologia utilizada para fabricar os
-processadores, os transistores. Isso possibilitou que memórias muito
-menores, mais rápidas e mais baratas fossem desenvolvidas. E melhor,
-elas poderiam ser inseridas muito próximas, e até dentro dos
-processadores, acompanhando sua miniaturização. E foi o que
-aconteceu. A medida que a tecnologia foi avançando e produzindo
-transistores cada vez menores, as memórias também foram encolhendo.</p></div>
-<div class="paragraph"><p>Os processadores tornaram-se cada vez menores e mais velozes, mas
-infelizmente o avanço não ocorreu também com a velocidade das
-memórias, mas apenas com o seu tamanho. Isso até hoje é um
-problema. Armazenamentos rápidos são muito complexos de fabricar e,
-por consequência, caros. Isso vem limitando o avanço da velocidade
-dos computadores, mas sempre os cientistas vêm encontrando
-alternativas para manter Gordon Moore e todos nós muito orgulhosos.</p></div>
-</div>
-<div class="sect3">
-<h4 id="_a_intel">A Intel</h4>
-<div class="paragraph"><p>A Intel Corporation, ou simplesmente Intel, surgiu nos Estados Unidos
-em 1968, como uma empresa focada no projeto e fabricação de
-circuitos integrados. Ela foi fundada por Gordon Moore (o mesmo da
-Lei de Moore) e Robert Noyce. Ela era inicialmente uma concorrente da
-IBM, mas logo se tornaram parceiras. A Intel fabricava os
-processadores e memória, e a IBM fazia a composição deles com
-outros componentes para montar os computadores.</p></div>
-<div class="paragraph"><p>Em 1971 a Intel lança seu primeiro processador, o 4004, que
-trabalhava com operações e dados de 4 bits. Foi uma revolução,
-pois todos componentes da CPU estavam num único chip. No ano
-seguinte eles lançam o 8008, já de 8 bits. Em 1974 é lançado o
-8080, primeiro processador de propósito geral. Ou seja, com ela
-tanto era possível executar aplicações científicas, financeiras,
-gráficas e jogos. O mesmo princípio dos processadores atuais. Ele
-foi substituído pelo 8086 de 16 bit. O próximo foi o 80286 que já
-era capaz de trabalhar com uma memória de 16MBytes. O 80386
-trabalhava com 32 bits e tinha suporte a multi-tarefas, ou seja, era
-finalmente possível executar mais de uma aplicação
-simultaneamente. Depois veio o 80486 com muito mais memória e bem
-mais rápido, além de um co-processador específico para
-aplicações matemáticas. A partir do 80286 as pessoas omitiam o 80
-ao falar do processador, chamando-o apenas de 286, 386 e 486.</p></div>
-<div class="paragraph"><p>Em seguida veio a geração Pentium, focando cada vez mais na
-execução de tarefas paralelas, adicionando várias unidades de
-processamento e armazenamento de dados dentro processador. Agora os
-processadores não teriam apenas uma ULA ou uma memória dentro do
-processador, mas várias delas. Hoje estamos na geração dos
-processadores multi-núcleos, ou multi-cores, que nada mais são do
-que vários processadores replicados dentro de um mesmo chip e
-coordenadores por uma unidade única.</p></div>
-</div>
-<div class="sect3">
-<h4 id="_a_apple_e_a_microsoft">A Apple e a Microsoft</h4>
-<div class="paragraph"><p>Em 1974 Steve Jobs e Steve Wosniak trabalhavam noites a fio para
-tentar, pela primeira vez, criar um computador que fosse voltado não
-a empresas, mas a pessoas também. Seria a ideia de um computador
-pessoal. Eles compraram todos componentes necessários para montar um
-computador, fizeram várias improvisações e inovações, acoplaram
-uma TV e um teclado. Wosniak, um gênio da eletrônica e
-programação, desenvolveu o software para controlar o computador e
-ainda alguns aplicativos, como uma planilha de cálculos e alguns
-jogos. Assim que o protótipo ficou prontos, Steve Jobs, eximiu
-negociador e vendedor, colocou o computador na mala de seu carro e
-foi visitar várias empresas para conseguir algum apoio financeiro
-para poder fabricar o produto em escalas maiores. Foi até na IBM,
-mas ouviu deles que o mercado de computadores pessoais não era
-promissor e o negócio deles era a produção de grandes computadores
-para empresas.</p></div>
-<div class="paragraph"><p>Assim que conseguiram o primeiro cliente, em 1976, Jobs e Wosniak
-fundaram a Apple e lançaram o Apple I. Um produto mais maduro e
-melhor acabado. Jobs sempre gostava de produtos de design
-diferenciado, que fossem não apenas eficientes, mas bonitos e,
-principalmente, fáceis de usar. Suas apresentações anuais de
-lançamento de novos produtos eram sempre aguardados com grande
-expectativa e especulações.</p></div>
-<div class="paragraph"><p>A IBM inicialmente também desenvolvia o Sistema Operacional e os
-programas que iriam ser executados por suas máquinas. Logo ela
-percebeu que poderia fazer parcerias com outras empresas e agregar
-ainda mais valor aos seus produtos. Foi aí que surgiu a Microsoft,
-liderada pelo seu fundador, Bill Gates, com o seu sistema
-operacionais MS-DOS. Não demorou muito para que todos computadores
-lançados pela IBM trouxessem também o MS-DOS integrados e eles.
-Depois surgiram as evoluções do MS-DOS, o Windows e suas várias
-gerações. A Microsoft se beneficiou bastante dessa parceria, já
-que todos a grande maioria dos computadores do mundo executavam seu
-sistema, as pessoas teriam que aprender e se familiarizar com seu
-sistema operacional. As empresas de desenvolvimento de aplicativos e
-jogos tinham que fazê-los compatíveis com o MS-DOS e Windows e foi
-aí que a Microsoft se tornou uma das líderes do mercado e, por
-muitos anos, a mais rica empresa do mundo.</p></div>
-<div class="paragraph"><p>Steve Jobs sempre acusou o Bill Gates de ter copiado dele o código
-principal para o funcionamento do primeiro sistema operacional
-Windows. Gates nunca negou. Eles sempre trocavam acusações e isso
-gerou muito assunto para a impressa e fanáticos por tecnologia. A
-verdade é que a Microsoft cresceu bastante e a Apple passou por
-vários apertos. Só no ano 2000, quando Jobs retornou à Apple
-depois de ter sido expulso da própria empresa que ele fundou, foi
-que as coisas melhoraram para a Apple. Eles lançaram produtos em
-outras linhas que não fossem computadores pessoais, como o iPod para
-ouvir música e o telefone celular iPhone. A Apple passou então a
-dominar o mercado de música online com sua loja de músicas, iTunes
-e o iPhone é o Smartphone mais vendido do mundo.</p></div>
-<div class="paragraph"><p>Steve Jobs seguia a filosofia não de fazer clientes, mas de criar
-fãs. E deu certo. Hoje há vários &#8220;Apple Maniamos&#8221; que compram
-seus produtos antes mesmo deles serem apresentados ao público. Nos
-dias em que esse livro está sendo escrito, a Apple ultrapassou a IBM
-e a Microsoft em valor, e é a empresa mais valiosa do mundo.</p></div>
-</div>
-</div>
-<div class="sect2">
-<h3 id="_recapitulando">Recapitulando</h3>
-<div class="paragraph"><p>Ao final desse capítulo vimos o que é a arquitetura de um
-computador e porque é tão importante estudá-la. Vimos que o
-transistor é o dispositivo básico para todo o funcionamento de um
-computador. Estudar seu funcionamento e sua evolução, é estudar a
-própria Ciência da Computação e a eletrônica digital. Depois de
-seu surgimento, os computadores foram possíveis e avançaram a
-medida que eles encolhiam de tamanho e aumentavam de velocidade,
-consumindo menos energia. Com a evolução dos computadores, cada vez
-mais rápidos, menores e mais baratos, toda a humanidade avançou na
-mesma velocidade. No próximo capítulo vamos estudar mais a fundo
-como os processadores funcionam. Como os programas são executados e
-o que é feito nos dias de hoje para que eles sejam cada vez mais
-eficientes.</p></div>
-</div>
-<div class="sect2">
-<h3 id="_atividades">Atividades</h3>
-<div class="ulist"><ul>
-<li>
-<p>
-Quais as quatro funções básicas que todos os computadores
-executam? Dê um exemplo de operação de cada uma delas.
-</p>
-</li>
-<li>
-<p>
-Quais os elementos básicos de um computador e quais as
-funcionalidades de cada um deles?
-</p>
-</li>
-<li>
-<p>
-Quais as diferenças entre um sinal analógico e um digital?
-Apresente os pontos fortes e fracos de cada um deles. Na sua
-opinião, qual dos dois sinais apresentam maior qualidade?
-</p>
-</li>
-<li>
-<p>
-Caracterize o que é uma Máquina de von Neumann
-</p>
-</li>
-<li>
-<p>
-O que são transistores? Quais as vantagens na concepção de
-computadores com o surgimento dos transistores?
-</p>
-</li>
-<li>
-<p>
-Por que quantos menores os transistores, mais velozes os
-computadores? Há desvantagens nessa miniaturização das máquinas?
-Quais?
-</p>
-</li>
-<li>
-<p>
-O que diz a Lei de Moore? Em sua opinião, há um limite para esse
-crescimento? Onde vamos chegar?
-</p>
-</li>
-<li>
-<p>
-Que outras técnicas podem ser utilizadas para aumento do
-desempenho dos processadores que não pela redução do tamanho dos
-transistores? Explique cada uma delas.
-</p>
-</li>
-</ul></div>
-</div>
-</div>
-</div>
-<div class="sect1">
-<h2 id="_unidade_central_de_processamento_cpu">Unidade Central de Processamento (CPU)</h2>
-<div class="sectionbody">
-<div class="quoteblock">
-<div class="title">Objetivos do capítulo</div>
-<div class="content">
-<div class="paragraph"><p>Ao final deste capítulo você deverá ser capaz de:</p></div>
-<div class="ulist"><ul>
-<li>
-<p>
-Identificar os principais componentes de uma CPU
-</p>
-</li>
-<li>
-<p>
-Conhecer o funcionamento de uma CPU
-</p>
-</li>
-<li>
-<p>
-Saber como um programa é executado em ciclos
-</p>
-</li>
-<li>
-<p>
-Definir e explicar o que é uma interrupção e suas consequências
-</p>
-</li>
-<li>
-<p>
-Argumentar sobre aspectos que influenciam no desempenho de uma CPU
-</p>
-</li>
-</ul></div>
-</div>
-<div class="attribution">
-</div></div>
-<div class="paragraph"><p>Nesse capítulo vamos estudar a parte mais importante de um
-computador, que é a Unidade Central de Processamento, ou UCP, ou, do
-inglês, CPU.
-A CPU é responsável não apenas por executar os programas contidos
-na memória, mas também de controlar todos os dispositivos de
-entrada e saída.
-Seu avanço ao longo dos anos tem permitido que programas fossem
-executados cada vez mais rapidamente.
-Hoje temos processadores de vários núcleos capazes de executar
-várias atividades ao mesmo tempo.
-São esses processadores e funcionalidades que iremos estudar nesse
-capítulo.</p></div>
-<div class="sect2">
-<h3 id="_o_que_é_um_programa">O que é um programa?</h3>
-<div class="paragraph"><p></p></div>
-<div class="paragraph"><p>Nesse momento, você não apenas deve saber o que é um programa,
-como já deve ter até já escrito seus próprios programas e
-entendido um pouco como o computador funciona.
-Os programas são sequências finitas de passos que foram definidas
-por um programador para alcançar um objetivo específico.
-Cada passo desse programa é chamado de instrução.
-Não necessariamente, uma instrução escrita em uma linguagem de
-alto nível, como C, Java, Python, por exemplo, é diretamente
-transformada em uma instrução de máquina e armazenada em memória
-para execução da CPU.
-Na verdade, geralmente, uma instrução de uma linguagem de alto
-nível embute vários comandos e ações a serem executadas pela CPU.
-Essa é a principal razão da criação dessas linguagens de alto
-nível.
-O programador deve ter o menor trabalho possível ao escrever um
-programa.
-Ele deve se preocupar com o problema que está tentando solucionar,
-ao
-invés de memorizar dezenas de comandos de uma linguagem de máquina
-extensa e repleta de detalhes.</p></div>
-<div class="paragraph"><p>Após compilado, o programa de linguagem de alto nível é
-transformado em um programa apenas com instruções de máquina.
-Cada instrução de máquina contém apenas uma única operação a
-ser realizada pela CPU.
-Para ser executado, esse programa deve ser transferido para a
-Memória Principal.
-No princípio, um Operador de Máquina, copiava todas as instruções
-para a memória de maneira quase que manual.
-Hoje em dia essa operação é realizada pelo Sistema Operacional
-(Windows, Linux etc.).
-Assim que um usuário clica com o mouse, ou pressiona a tecla Enter
-do teclado solicitando que um determinado programa execute, o Sistema
-Operacional copia o programa para a memória e solicita que a CPU o
-execute.</p></div>
-<div class="paragraph"><p>Não podemos esquecer que a memória do computador apenas armazena
-números binários.
-Então, podemos dizer que um programa em linguagem de máquina é
-formado por instruções em binário.
-A cada instrução trazida da memória, a CPU lê seu código
-binário de operação para saber do que se trata, e inicia o
-processo de execução.
-Dependendo da operação, que pode ser de movimentação de dados,
-uma operação lógica, ou aritmética, ou uma operação de
-armazenamento de dados, a CPU envia ordens para que os outros
-dispositivos do computador atuem de forma a completar a operação.
-Essas ordens são enviadas através de pulsos elétricos passados por
-fios dentro do computador. Esses fios são chamados de <strong>Barramento de
-Controle</strong>.</p></div>
-<div class="sect3">
-<h4 id="_software_x_hardware">Software X Hardware</h4>
-<div class="paragraph"><p> </p></div>
-<div class="paragraph"><p>O computador é composto por dois elementos, o software e o hardware.
-Tanto o hardware quando o software foram escritos por um programador,
-ou engenheiro, para se resolver um determinado problema.
-O início é sempre o mesmo. O profissional se depara com um problema
-e projeta uma solução algorítmica para ele.
-A diferença está na concepção. O hardware é concebido em chip,
-utilizando transistores interconectados.
-Uma vez elaborado, o hardware não pode mais ser modificado. Ele é
-uma solução rígida (do inglês, Hard) para o problema.
-Já o software é elaborado para ser armazenado numa memória e ser
-executado com um processador de propósito geral.
-Ele é uma solução flexível (do inglês, Soft) para o problema,
-já que o programador pode, a cada momento, modificar seu programa
-afim de torná-lo cada vez melhor.</p></div>
-<div class="paragraph"><p>Soluções em software são sempre mais lentas do que soluções
-equivalentes em hardware.
-Isso porque para executar um programa, cada instrução deve antes
-ser armazenada em memória, transferidas para a CPU (lembre-se que
-memórias são muito mais lentas do que CPUs) e, só então, ser
-executada pela CPU.
-Já as soluções em hardware não utilizam instruções, elas
-executam as operações diretamente.</p></div>
-<div class="paragraph"><p>Por outro lado, as soluções em software ganham em flexibilidade,
-já que os programas podem ser facilmente modificados.
-Já as soluções em hardware, não.
-Uma vez concebido, um hardware não pode mais ser modificado, ele
-deve ser descartado para dar lugar a uma versão mais nova.
-Isso torna projetos em hardware muito mais caros.</p></div>
-<div class="paragraph"><p>Para entender melhor, podemos citar alguns exemplos de
-implementações em hardware comumente utilizadas.
-Todas são escolhidas devido ao seu caráter de pouca necessidade de
-modificação, mas muito demanda por alto desempenho.
-Por exemplo, chips de criptografia para celulares (geralmente
-smartphones), processadores aritméticos para acelerar o cálculos,
-aceleradores gráficos para gerar gráficos mais rápidos, alguns
-chips para fazer edições rápidas em fotos, geralmente acoplados
-às câmeras digitais. As implementações são feitas em software
-quando a demanda por desempenho não é tanta, ao mesmo tempo em que
-as atualizações são frequentes, como os Sistemas Operacionais, os
-jogos e aplicativos em geral.</p></div>
-<div class="paragraph"><p>Apesar de não ser tão rápida quanto gostaríamos, a CPU é uma
-solução muito boa por permitir a execução de, praticamente,
-qualquer tipo de programa, se tornando uma máquina de propósito
-geral.</p></div>
-</div>
-</div>
-<div class="sect2">
-<h3 id="_estrutura_de_uma_cpu">Estrutura de uma CPU</h3>
-<div class="paragraph"><p></p></div>
-<div class="paragraph"><p>Toda CPU é formada por duas unidades, como podem ser vistas na
-<a href="#fig_CPU">[fig_CPU]</a>:</p></div>
-<div class="ulist"><ul>
-<li>
-<p>
-Unidade de Controle (UC)
-</p>
-</li>
-<li>
-<p>
-Unidade de Ciclo de Dados (UCD)
-</p>
-</li>
-</ul></div>
-<div class="imageblock" id="fig_CPU">
-<div class="content">
-<img src="images/cap2/fig_CPU.eps" alt="images/cap2/fig_CPU.eps" />
-</div>
-<div class="title">Figura 6. Estrutura de uma CPU</div>
-</div>
-<div class="paragraph"><p>A Unidade de Controle é responsável por receber instruções pelo
-Barramento de Instruções. As instruções vêm da memória de
-acordo com o endereço enviado pela UC para a memória através do
-Barramento de Endereço das Instruções (à esquerda da UC na
-<a href="#fig_CPU">[fig_CPU]</a>).
-Já Unidade de Ciclo de Dados, como o próprio nome deixa entender,
-é responsável por tratar os dados propriamente ditos.
-A Unidade de Controle não executa as instruções.
-Ela as lê, decodifica e passa os comandos para a UCD determinando
-como as instruções devem ser executadas e com quais dados.
-Baseada nesses comandos, a UCD pode ir buscar os dados necessários
-na memória, executar as devidas operações e enviar o resultado de
-volta para a memória para ser armazenado.
-Tudo controlado de acordo com os comandos internos enviados pela
-Unidade de Controle, que por sua vez se baseia na instrução
-decodificada.
-Os dados lidos, ou enviados para a memória, são transmitidos
-através do Barramento de Dados.
-Os endereços são enviados para a memória através do Barramento de
-Endereço.</p></div>
-<div class="paragraph"><p></p></div>
-<div class="paragraph"><p>Tudo isso é controlado por um sinal síncrono de relógio (clock, do
-inglês).
-A cada batida do relógio a unidade sabe que deve executar um passo,
-passar os dados para quem deve, e se preparar para o próximo passo.
-Quanto mais rápido é o relógio mais operações por segundo o
-processador consegue executar e mais rápido pode se tornar.
-A velocidade do relógio é medida em frequência, utilizando a
-unidade Hertz (abreviatura é Hz).
-Um Hertz significa um passo por segundo.
-Os processadores atuais trabalham na faixa dos poucos GHz (leia-se
-Giga Hertz), entre 1 GHz e 5 GHz.
-Um Giga Hertz significa um bilhão de passos por segundo.
-É por isso que os computadores são tão incríveis.
-Eles não executam operações extraordinárias. Pelo contrário.
-Executam operações extremamente simples, como somas, subtrações e
-multiplicações, mas fazem isso numa velocidade incrível.</p></div>
-<div class="sect3">
-<h4 id="_os_papéis_dos_barramentos_e_da_memória">Os papéis dos barramentos e da memória</h4>
-<div class="paragraph"><p></p></div>
-<div class="paragraph"><p>Saindo um pouco de dentro da CPU, podemos enxergar os barramentos e a
-Memória Principal, como é apresentado na <a href="#fig_CPU_com_barramento">[fig_CPU_com_barramento]</a>.
-Para facilitar a visualização, os Barramentos de Dados e de
-Endereço são apresentados replicados, tanto do lado esquerdo,
-quanto do direito da figura.</p></div>
-<div class="imageblock" id="fig_CPU_com_barramento">
-<div class="content">
-<img src="images/cap2/fig_CPU_com_barramento.eps" alt="images/cap2/fig_CPU_com_barramento.eps" />
-</div>
-<div class="title">Figura 7. Estrutura de uma CPU com barramentos</div>
-</div>
-<div class="paragraph"><p>A comunicação da Unidade de Controle e da Unidade de Ciclo de Dados
-é feita sempre com a Memória Principal através dos barramentos.
-Os endereços são transmitidos sempre via Barramento de Endereços
-para a memória, sempre de forma unidirecional da CPU para a memória.
-Quando as instruções são transmitidas da memória para a Unidade
-de Controle, elas utilizam o Barramento de Dados.
-Isso porque as instruções são tratadas pela memória como um
-conteúdo como um outro qualquer.
-Ela não faz distinção entre dados e instruções.
-O mesmo Barramento de Dados é utilizado pela Unidade de Ciclo de
-Dados para receber os operandos das operações a serem realizadas e
-para enviar os resultados de volta para a memória.</p></div>
-<div class="paragraph"><p>Fica claro então a importância da Memória Principal.
-Todo e qualquer programa só poderá ser executado a partir dela.
-Quando você, por exemplo, deseja executar um programa de um pendrive
-conectado pela USB do computador, ele antes precisa ser copiado para
-a Memória Principal.
-Só então ele será executado.
-A memória precisa ser grande o bastante para armazenar a maior
-quantidade possível de programas, e também precisa ser rápida o
-suficiente para buscar os dados e enviá-los o mais rapidamente
-possível à CPU, e também salvá-los no menor tempo possível.
-A velocidade das memórias é determinada essencialmente pela
-tecnologia de transistores utilizada.
-Essa tecnologia é relacionada ao preço. Quanto mais rápidas, mais
-caras elas são.</p></div>
-</div>
-<div class="sect3">
-<h4 id="sec_registradores">Os registradores</h4>
-<div class="paragraph"><p></p></div>
-<div class="paragraph"><p>Os registradores são memórias elaboradas com o mínimo de
-transistores possível, utilizando o que há de mais moderno em
-tecnologia de armazenamento.
-Elas são as memórias mais rápidas que podem ser construídas e por
-isso são também as mais caras.
-Por essa razão, elas aparecem numa quantidade muito pequena em um
-computador, na casa de alguns Kilo Bytes.
-Eles podem ser divididos em dois grupos.
-Os registradores de propósito geral, e os de propósito específico.
-Como o próprio nome diz, os primeiros podem ser utilizados pelos
-programas para quaisquer objetivos, já os segundos são específicos
-para algumas tarefas.
-Por exemplo, há um registrador na CPU para controlar se o
-processador deve continuar em execução, ou entrar em modo de espera
-por nova ordem.
-Se esse registrador receber um valor diferente de zero, o processador
-entrará em modo de espera, até que receba a ordem de modificar esse
-valor.
-Na <a href="#fig_arq_detalhada">[fig_arq_detalhada]</a> os registradores de propósito específico
-apresentados são:</p></div>
-<div class="ulist"><ul>
-<li>
-<p>
-Program Counter (PC): Contador de Programas
-</p>
-</li>
-<li>
-<p>
-Instruction Register (IR): Registrador de Instrução
-</p>
-</li>
-<li>
-<p>
-Memory Address Register (MAR): Registrador de Endereço
-</p>
-</li>
-<li>
-<p>
-Memory Buffer Register (MBR): Registrador de Dados
-</p>
-</li>
-</ul></div>
-<div class="imageblock" id="fig_arq_detalhada">
-<div class="content">
-<img src="images/cap2/fig_arq_detalhada.eps" alt="images/cap2/fig_arq_detalhada.eps" />
-</div>
-<div class="title">Figura 8. Estrutura de uma CPU com registradores</div>
-</div>
-<div class="paragraph"><p>O PC contém o endereço de memória que será utilizado para buscar
-a próxima instrução a ser executada pela CPU.
-Antes de executar qualquer instrução, a CPU envia o conteúdo de PC
-para a memória através do Barramento de Endereço, a memória envia
-o conteúdo da memória nesse endereço através do Barramento de
-Dados.
-Esse conteúdo é então armazenado no IR.
-Já o IR, que recebeu a instrução que veio da memória, tem o
-objetivo de guardar a instrução e passá-la para a Unidade de
-Controle, que é quem vai lê-la e tomar as decisões necessárias
-para para que ela seja executada pela Unidade de Ciclo de Dados.
-Por se tratarem do processo de busca de instruções, o PC e o IR
-ficam instalados na Unidade de Controle.
-O PC possui conexão direta com o Barramento de Endereços, e o IR
-com o Barramento de Instruções.</p></div>
-<div class="paragraph"><p>Com relação ao MAR e ao MBR, eles possuem funções análogas ao PC
-e IR, respectivamente, mas referentes a dados e não a instruções.
-Quando uma operação precisa ser realizada com algum dado que está
-na memória (e não em um registrador), o endereço desse dado é
-passado para o MAR.
-A CPU então passa o conteúdo de MAR para a memória através do
-Barramento de Endereço, que retornará o conteúdo da memória nesse
-endereço através do Barramento de Dados.
-O conteúdo trazido pela memória será armazenado em MBR.
-Só então o dado poderá ser utilizado para o processamento
-inicialmente planejado.
-O MBR e MAR possuem, respectivamente, conexões diretas com os
-Barramentos de Dados e de Endereços. Ambos são situados na Unidade
-de Ciclo de Dados, por serem utilizados nas fases de processamento
-das instruções.</p></div>
-<div class="paragraph"><p>O tamanho e quantidade dos registradores de uma CPU é uma das
-principais decisões de projeto.
-Se forem grandes demais, ou em quantidade maior do que a necessária,
-podem resultar em desperdício e aumento desnecessário no preço do
-processador.
-Já se forem pequenos, ou em pouca quantidade, com certeza vão
-tornar o computador muito mais lento do que o desejado.
-Encontrar o tamanho e quantidade ideais é trabalhoso e geralmente é
-feito através de simuladores e de muito testes e anos de
-experiência.</p></div>
-<div class="paragraph"><p>Os registradores de propósito geral são utilizados para guardar as
-variáveis dos programas. Como eles estão presentes em quantidades
-muito pequenas, são poucas as variáveis que ficam armazenadas em
-registradores. As demais ficam na Memória Principal. Quando uma
-operação precisa ser realizada e seus dados estão nos
-Registradores de Propósito Geral, a CPU não precisa buscá-los na
-memória e o processamento torna-se muito mais rápido.</p></div>
-<div class="admonitionblock">
-<table><tr>
-<td class="icon">
-<div class="title">Importante</div>
-</td>
-<td class="content">Lembre-se que as memórias são muito mais lentas do que os
-processadores!</td>
-</tr></table>
-</div>
-<div class="paragraph"><p>A CPU tenta ao máximo manter as variáveis mais utilizadas nos
-registradores. Ela faz isso guardando aquelas mais usadas nas
-últimas operações. Nem sempre isso funciona, mas no geral, é a
-melhor solução.</p></div>
-<div class="admonitionblock">
-<table><tr>
-<td class="icon">
-<div class="title">Nota</div>
-</td>
-<td class="content">Faça suas variáveis mais importantes serem bastante utilizadas.
-Usando-as em repetições, por exemplo.
-Isso aumentará as chances delas serem armazenadas em registradores,
-podendo acelerar a execução dos seus programas.</td>
-</tr></table>
-</div>
-</div>
-<div class="sect3">
-<h4 id="sec_ULA">Unidade Lógica e Aritmética (ULA)</h4>
-<div class="paragraph"><p>A Unidade Lógica e Aritmética, ou ULA, se assemelha muito com uma
-calculadora convencional.
-Ela executa operações lógicas e aritméticas.
-As ULAs modernas executam operações tanto com inteiros, como com
-números reais.
-A ULA recebe como entrada dois diferentes dados que são trazidos
-para ela dos registradores (de propósito geral, ou específicos)
-(veja a <a href="#fig_arq_detalhada">[fig_arq_detalhada]</a>).
-Quem decide que registradores passarão seus dados para a ULA é a
-Unidade de Controle baseada no tipo da instrução que está sendo
-executada.
-A Unidade de Controle também envia para a ULA qual operação será
-realizada (soma, multiplicação, divisão, AND, OR etc.).
-Assim que isso é feito, a ULA executa a operação e gera um
-resultado na sua saída.
-Esse resultado também é passado para um registrador escolhido pela
-Unidade de Controle, baseando-se na instrução em execução.</p></div>
-</div>
-<div class="sect3">
-<h4 id="sec_UC">Unidade de Controle (UC)</h4>
-<div class="paragraph"><p>A Unidade de Controle, ao receber a instrução que está armazenada
-em IR, a decodifica e envia os sinais de controle para onde for
-necessário.
-Decodificar nada mais é do que ler um código em binário e
-interpretar a operação relativa a esse código.
-Dependendo da operação, os sinais de controle podem ser internos,
-por exemplo, para a ULA executar uma soma, ou para o conteúdo de um
-registrador ser transferido para a ULA.
-Ou pode ser externo, para um dispositivo de entrada e saída, por
-exemplo, ou mesmo para a Memória Principal.
-Tudo isso depende da instrução a ser executada.</p></div>
-<div class="paragraph"><p>Na próxima seção será apresentada a execução de instruções em
-mais detalhes, o que facilitará o entendimento do funcionamento das
-CPUs.</p></div>
-</div>
-</div>
-<div class="sect2">
-<h3 id="_ciclo_de_instrução">Ciclo de Instrução</h3>
-<div class="paragraph"><p>Toda CPU trabalha em dois ciclos principais, o Ciclo de Busca e o
-Ciclo de Execução, como pode ser visto na <a href="#fig_ciclo_instrucao">[fig_ciclo_instrucao]</a>.
-Assim que o computador é iniciado, a CPU entra no Ciclo de Busca, em
-seguida passa para o Ciclo de Execução e depois volta para o Ciclo
-de Busca.
-Ela continua nesse processo até que precise ser desligada, saindo do
-Ciclo de Execução para o estado final.</p></div>
-<div class="imageblock graphviz" id="fig_ciclo_instrucao">
-<div class="content">
-<img src="livro__1.png" alt="livro__1.png" />
-</div>
-<div class="title">Figura 9. Ciclo de Instrução</div>
-</div>
-<div class="paragraph"><p>Durante o Ciclo de Busca, é a Unidade de Controle que atua.
-Uma nova instrução é buscada da Memória para que possa ser
-decodificada.
-Nessa fase os registradores <a href="#PC">[PC]</a> e <a href="#IR">[IR]</a> são utilizados, como
-apresentados na seção anterior.
-O PC é logo lido para se saber que instrução será executada, essa
-instrução é trazida para o IR e, finalmente, é decodificada pela
-Unidade de Controle.
-Assim que esse processo termina, caso a instrução não diga
-respeito à um laço, ou à uma repetição, o conteúdo de PC é
-incrementado. Ou seja, PC recebe PC + 1.
-Assim, no próximo Ciclo de Busca a instrução do endereço seguinte
-será carregada da memória e executada.
-Esse comportamento garante a característica de execução sequencial
-dos programas.</p></div>
-<div class="paragraph"><p>No passo seguinte a CPU entra em Ciclo de Execução.
-Nessa etapa atua a Unidade de Ciclo de Dados.
-Agora a Unidade de Controle já sabe exatamente que operação será
-executada, com quais dados e o que fazer com o resultado.
-Essa informação é passada para a ULA e os registradores envolvidos.
-Durante o Ciclo de Execução há cinco possíveis tipos de
-operação que podem ser executadas:</p></div>
-<div class="dlist"><dl>
-<dt class="hdlist1">
-Processador e memória
-</dt>
-<dd>
-<p>
-trata simplesmente da transferência de
-dados entre CPU e memória principal;
-</p>
-</dd>
-<dt class="hdlist1">
-Processador e Entrada e Saída
-</dt>
-<dd>
-<p>
-diz respeito à transferência de
-dados entre a CPU e um dispositivo de Entrada e Saída, como teclado,
-mouse, monitor, rede, impressora etc.;
-</p>
-</dd>
-<dt class="hdlist1">
-Processamento de Dados
-</dt>
-<dd>
-<p>
-são operações simplesmente de
-processamento dos dados, como operação aritmética ou lógica sobre
-os registradores da CPU;
-</p>
-</dd>
-<dt class="hdlist1">
-Controle
-</dt>
-<dd>
-<p>
-são instruções que servem para controlar os
-dispositivos do computador, como para ligar um periférico, iniciar
-uma operação do disco rígido, ou transferir um dado que acabou de
-chegar pela Internet para a Memória Principal;
-</p>
-</dd>
-<dt class="hdlist1">
-Operações compostas
-</dt>
-<dd>
-<p>
-são operações que combinam uma ou mais
-instruções das outras em uma mesma operação.
-</p>
-</dd>
-</dl></div>
-<div class="sect3">
-<h4 id="_busca_de_dados">Busca de Dados</h4>
-<div class="paragraph"><p></p></div>
-<div class="paragraph"><p>Em operações entre Processador e Memória, é necessário que dados
-sejam trazidos da memória para servirem de entrada para a ULA, e/ou
-o resultado seja levado para armazenamento na memória no final da
-execução.
-Para isso acontecer, é executada uma Busca de Dados. Isso é
-determinado durante a decodificarão da instrução, no ciclo de
-Busca de Instrução.
-Isso acontece quando um dos parâmetros de uma operação aritmética
-é um endereço de memória, e não um valor diretamente, nem um
-registrador.
-Para isso, parte do conteúdo de <a href="#IR">[IR]</a> é transferido para o <a href="#MAR">[MAR]</a>. Essa
-parte é justamente o endereço do parâmetro da instrução.
-Em seguida a Unidade do Controle requisita à memória uma leitura.
-Assim, o endereço, agora em MAR, é passado para a memória e o
-conteúdo lido da memória é passado para o <a href="#MBR">[MBR]</a>.
-Agora o conteúdo é transferido para a ULA para que a operação
-seja executada (lógica ou aritmética).</p></div>
-<div class="paragraph"><p>Se a instrução tiver dois ou mais parâmetros de memória, serão
-necessárias outras Buscas de Dados.
-Como a memória é sempre mais lenta do que a CPU, instruções que
-necessitam Buscas de Dados são muito mais lentas do que instruções
-de Processamento de Dados.</p></div>
-<div class="paragraph"><p>Perceba que cada instrução pode exigir mais tempo de execução do
-que outras. Isso depende de quantos acessos à memória ela exigirá.
-Quanto mais acessos à memória, mais lenta a instrução.
-O ideal é sempre usar registradores.
-Mas nem sempre é possível utilizar registradores.
-Eles estão sempre em poucas quantidades e em menores tamanhos.
-Principalmente por serem caros.
-O que os computadores sempre tentam fazer é passar os dados da
-memória para os registradores assim que puderem, para que as
-próximas instruções sejam aceleradas.</p></div>
-</div>
-</div>
-<div class="sect2">
-<h3 id="_interrupções">Interrupções</h3>
-<div class="paragraph"><p></p></div>
-<div class="paragraph"><p>Além do ciclo básico de instrução apresentado anteriormente, a CPU
-pode ainda executar outro tipo de tarefa.
-Ela diz respeito ao processamento de pedidos oriundos dos
-dispositivos de Entrada e Saída.
-Como o Ciclo de Instrução da CPU que vimos até o momento é
-fechado, ou seja, a CPU sempre fica em estado de repetição até que
-seja desligada, ela não pode atender a nenhum evento externo que
-não seja a execução de um programa.
-Por exemplo, quando um usuário pressiona uma tecla do teclado, ou
-faz um movimento com o mouse, ou mesmo, quando uma mensagem chega
-pela Internet através da placa de rede.
-O que a CPU deve fazer?
-Se ela estiver em um Ciclo de Instrução fechado como mostrado
-anteriormente, nada.
-Ela precisa parar o que está fazendo para atender ao evento ocorrido
-e, só então, voltar ao Ciclo de Instruções.
-Esse processo de parar o Ciclo de Instrução para atender a um
-evento externo é chamado de Interrupção.</p></div>
-<div class="paragraph"><p>O Ciclo de Instrução pode agora ser visto modificado na
-<a href="#fig_ciclo_com_interrupcao">[fig_ciclo_com_interrupcao]</a> para atender às Interrupções.
-Todas as interrupções são recebidas e armazenadas internamente por um
-dispositivo chamado Gerenciador de Interrupções.
-Esse dispositivo é um chip, semelhante à uma CPU, mas bem mais simples.</p></div>
-<div class="imageblock graphviz" id="fig_ciclo_com_interrupcao">
-<div class="content">
-<img src="livro__2.png" alt="livro__2.png" />
-</div>
-<div class="title">Figura 10. Ciclo de Instruções com interrupções</div>
-</div>
-<div class="paragraph"><p>Na maioria dos computadores eles vêm soldados na Placa-Mãe, mas
-podem também vir dentro do chip da CPU.
-Toda interrupção possui um código de identificação. Sempre que
-uma nova interrupção chega nesse gerenciador, ele armazena esse
-código em sua memória e manda um sinal para CPU através do
-Barramento de Controle.
-Durante seu Ciclo de Instrução, sempre que uma instrução é
-executada, antes de voltar para o Ciclo de Busca, a CPU checa se
-algum sinal de interrupção foi enviado pelo Gerenciador de
-Interrupção.</p></div>
-<div class="paragraph"><p>Quando não há uma interrupção, a execução volta ao Ciclo de
-Busca e o programa em execução continua a ser executado.
-Mas se houver uma interrupção, a CPU agora vai parar a execução
-do programa atual para atender a interrupção.
-Por exemplo, vamos supor que o usuário tenha pressionado uma tecla
-do teclado.
-O código armazenado pelo Gerenciador de Interrupção indica que a
-interrupção veio do teclado.
-A CPU pára sua execução do programa anterior e vai iniciar a
-execução de um programa especial, o Tratador de Interrupção.
-O código do dispositivo (aqui seria o teclado) serve para a CPU
-saber o endereço do Tratador de Interrupção que ela vai buscar da
-memória.
-Então, ao sair da Checagem de Interrupção, a CPU muda o endereço
-do PC para o endereço do Tratador de Instrução.
-Assim, no Ciclo de Busca a próxima instrução a ser trazida da
-memória e posteriormente executada será a do tratador do teclado.</p></div>
-<div class="paragraph"><p>Cada tipo de interrupção precisa de um tratamento específico a ser
-feito. No caso do teclado, o tratador vai checar que tecla foi
-pressionada.
-Isso é feito através de uma leitura à memória do teclado (sim,
-todos os dispositivos possuem uma pequena memória) para saber que
-tecla foi pressionada.
-Dependendo da tecla, uma operação diferente será executada.
-Geralmente, a CPU adiciona o código da tecla pressionada num
-endereço específico de memória. Cada programa, lendo essa
-informação, tomará sua própria decisão sobre o que deve ser
-feito.
-O que acontece é que apenas o programa ativo no momento, vai ler
-esse conteúdo, executar a ação da tecla e limpar essa área de
-memória.
-Se o programa for um editor de texto, por exemplo, o código pode
-representar escrever a letra pressionada na posição atual do cursor
-dentro do texto.</p></div>
-<div class="paragraph"><p>Quando esse processo encerra, o tratamento é encerrado, e a CPU deve
-voltar à execução do programa que havia sido interrompido.
-Isso só é possível porque, antes de passar à execução do
-Tratador de Interrupção, a CPU salva os conteúdos de todos os
-registradores da CPU (inclusive o PC e o IR).
-Então, antes de devolver a execução para o programa, a CPU
-restaura
-todos os valores dos registradores antes salvos.
-Dessa forma, o programa retoma exatamente do ponto em que parou.</p></div>
-<div class="paragraph"><p>As interrupções também ocorrem se o próprio programa em
-execução executar uma operação ilegal.
-Isso é feito para evitar que a CPU entre em erro.
-Por exemplo, se um programa tentar acessar uma área da memória que
-é proibida para ele, como a área de outro programa ou do Sistema
-Operacional.
-Nesse caso, o programa é interrompido e não volta mais a executar,
-ele é finalizado e a execução é devolvida ao Sistema Operacional.
-Algo semelhante ocorre em caso de defeitos em alguns dispositivos.
-Por exemplo, se um programa estiver lendo um arquivo que está em um
-pendrive, e esse pendrive é removido subitamente, uma interrupção
-é lançada e o programa é encerrado, já que ele não faz mais
-sentido estar em execução.</p></div>
-</div>
-<div class="sect2">
-<h3 id="_sobre_o_desempenho">Sobre o desempenho</h3>
-<div class="paragraph"><p>É possível agora perceber que o desempenho das CPUs depende de
-muito outros fatores além da velocidade do seu clock.
-O computador precisa ter memórias rápidas para reduzir o tempo dos
-Ciclos de Busca, precisam de mais registradores para usar menos a
-memória e também que poucas interrupções ocorram.
-Cada vez que uma interrupção ocorre, o programa deve ser
-interrompido e a chamada deve ser atendida.
-Isso vai atrasar demais o tempo de execução dos programas, dando a
-impressão de baixo desempenho.</p></div>
-<div class="paragraph"><p>Basicamente, há dois tipos programas, os orientados à CPU e os
-orientados a Entrada e Saída. Na <a href="#fig_entrada_saida">[fig_entrada_saida]</a> o
-comportamento dos primeiros é mostrado na parte a) e o dos segundos
-na parte b).</p></div>
-<div class="imageblock" id="fig_entrada_saida">
-<div class="content">
-<img src="images/cap2/fig_entrada_saida.eps" alt="images/cap2/fig_entrada_saida.eps" />
-</div>
-<div class="title">Figura 11. Execução com várias interrupções</div>
-</div>
-<div class="paragraph"><p>Quando um programa é orientado à CPU, há momentos longos de
-processamento de CPU e curtos momentos de espera por um evento de
-Entrada e Saída. É o exemplo de programas que fazem muitos
-cálculos matemáticos, como ferramentas de simulação, projetos de
-engenharia, computação gráfica e planilhas de cálculos.
-Inicialmente os dados de entrada são passados por um dispositivo de
-entrada, há longos momentos de cálculos e depois os resultados são
-passados para um dispositivo de entrada e saída.</p></div>
-<div class="paragraph"><p>Já nos programas orientados à Entrada e Saída (b), que são aqueles
-chamados também de interativos, há muitos momentos de interação e
-uso de dispositivos de Entrada e Saída, e poucos momentos de uso de
-CPU. Esse é o caso de programas que utilizam muito o mouse e o
-teclado, como os jogos e a própria navegação na internet.</p></div>
-<div class="paragraph"><p>O que temos que ter em mente é que o desempenho de um computador
-está muito ligado ao perfil de cada usuário. Os Sistemas
-Operacionais são os responsáveis por escolher que tarefa colocar
-para executar a cada momento e por quanto tempo ela deve executar
-até que uma nova tarefa entre em execução. Assim, o papel do
-Sistema Operacional também é fundamental e determinante no
-desempenho do sistema. O que ele tenta fazer no máximo que pode, é
-tentar ocupar os tempos de espera de um programa com a execução de
-outro. Tarefa nada fácil!</p></div>
-</div>
-<div class="sect2">
-<h3 id="_exemplo_de_execução_de_um_programa">Exemplo de execução de um programa</h3>
-<div class="paragraph"><p>Suponha que queiramos executar uma instrução de máquina que soma
-dois números que estão na memória e salve o resultado em outro
-endereço de memória.
-Para tal, vamos indicar que a memória (M) se comporta como um vetor
-(um array) e entre colchetes indicaremos o endereço do dado, ou da
-instrução.
-Sendo assim, a instrução que gostaríamos de executar seria:</p></div>
-<div class="listingblock">
-<div class="content">
-<pre><tt>200: M[100] = M[101] + M[102]</tt></pre>
-</div></div>
-<div class="paragraph"><p>Nesse caso, vamos ler que no endereço <tt>200</tt> da memória há uma
-instrução que precisa somar o conteúdo do endereço <tt>101</tt>, com o
-conteúdo do endereço <tt>102</tt> e salvar o resultado no endereço <tt>100</tt>
-da
-memória. Supondo que <tt>M[101]</tt> contenha o valor <tt>10</tt>, e <tt>M[102]</tt>
-contenha o
-valor <tt>20</tt>, ao final da execução, o endereço <tt>100</tt> de memória
-(<tt>M[100]</tt>) deverá conter o valor <tt>30</tt>.</p></div>
-<div class="paragraph"><p>Como uma instrução como essa será executada depende de cada
-arquitetura. Aqui vamos utilizar uma abordagem que quebra as
-instruções em pequenos passos simples, que facilitam o trabalho de
-decodificarão da CPU.</p></div>
-<div class="paragraph"><p>Sendo assim, esse programa seria transformado na seguinte sequência
-de instruções e executado.</p></div>
-<div class="listingblock">
-<div class="content">
-<pre><tt>PC = 200;
-
-//Envia comando de leitura de instrução para a memória
-
-IR &lt;- (M[100] = M[101] + M[102]) // Busca instrução da memória
-
-PC = PC + 1
-
-//Instrução é passada do IR para a Unidade de Controle</tt></pre>
-</div></div>
-<div class="paragraph"><p>A primeira ação seria realizar o <strong>Ciclo de Busca</strong>, visando trazer a
-instrução a ser executada da memória para o processador.
-O endereço da instrução (<tt>200</tt>) seria passado para o <tt>PC</tt> e um
-comando
-de leitura de instrução seria passado para a memória.
-Baseada no endereço trazido por <tt>PC</tt>, a memória localizaria a
-instrução e a enviaria para o processador, que a armazenaria no
-registrador <tt>IR</tt>.
-Antes de passar a instrução para a Unidade de Controle para dar
-início à execução, o registrador <tt>PC</tt> é atualizado para o
-próximo
-endereço de memória, no caso, <tt>201</tt>.</p></div>
-<div class="paragraph"><p>O próximo passo será iniciar o <strong>Ciclo de Execução</strong>:</p></div>
-<div class="listingblock">
-<div class="content">
-<pre><tt>//O primeiro dado é trazido da memória para o registrador R1
-
-MAR = 101
-
-//Envia comando de leitura de dado para a memória
-
-MBR &lt;- 10
-
-R1 = MBR    // valor lido da memória é passado para o registrador R1</tt></pre>
-</div></div>
-<div class="paragraph"><p>Como os dados a serem operados estão também na memória, é antes
-necessário executar uma operação de <strong>Busca de Operando</strong>, ou <strong>Busca
-de Dado</strong>.
-O primeiro operando está no endereço <tt>101</tt>. Sendo assim, o endereço
-<tt>101</tt> é passado para o registrador de endereço (<tt>MAR</tt>).
-Esse endereço é passado para a memória e é enviado um comando de
-leitura de dado.
-O conteúdo, o valor <tt>10</tt>, é então localizado pela memória e enviado
-para o processador, que o armazena no registrador de dados (<tt>MBR</tt>).
-Como o <tt>MBR</tt> será utilizado nas próximas etapas de execução, seu
-conteúdo é salvo em um registrador de propósito específico, o
-<tt>R1</tt>.</p></div>
-<div class="paragraph"><p>Em seguida, a Unidade de Controle passa para a busca do segundo
-operando, contido no endereço <tt>102</tt>:</p></div>
-<div class="listingblock">
-<div class="content">
-<pre><tt>//O segundo dado é trazido da memória para o registrador R1
-
-MAR = 102
-
-//Envia comando de leitura de dado para a memória
-
-MBR &lt;- 20
-
-R2 = MBR   // valor lido da memória é passado para o registrador R2</tt></pre>
-</div></div>
-<div class="paragraph"><p>Essa etapa ainda faz parte do <strong>Ciclo de Execução</strong>, e também diz
-respeito à uma <strong>Busca de Dado</strong>.
-A busca é mesma do passo anterior, mas agora o endereço buscado é
-o <tt>102</tt>, e o conteúdo é o <tt>20</tt>, que é repassado para o registrador
-<tt>R2</tt>.</p></div>
-<div class="paragraph"><p>O próximo passo do <strong>Ciclo de Execução</strong> é executar a operação
-aritmética propriamente dita.
-Isso geralmente é feito entre registradores de propósito geral, por
-serem mais rápidos do que se fosse tratar dados da memória.
-Os conteúdos de <tt>R1</tt> e <tt>R2</tt> são somados e armazenados em <tt>R3</tt>:</p></div>
-<div class="listingblock">
-<div class="content">
-<pre><tt>R3 = R1 + R2</tt></pre>
-</div></div>
-<div class="paragraph"><p>Para finalizar o processo, o resultado deve ser armazenado de volta
-na memória:</p></div>
-<div class="listingblock">
-<div class="content">
-<pre><tt>MAR = 100   // Endereço é passado para MAR
-
-MBR = R3    // Resultado da operação é passado para MBR
-
-// Comando de escrita é passado para a memória
-
-M[100] &lt;- 30    // Endereço 100 da memória recebe o valor 30</tt></pre>
-</div></div>
-<div class="paragraph"><p>Para isso ser realizado, é preciso executar uma operação de
-escrita na memória.
-O endereço <tt>100</tt> é então passado para <tt>MAR</tt> e o resultado da
-operação, salvo em <tt>R3</tt> é passado para <tt>MBR</tt>.
-Quando o comando de escrita é enviado pela Unidade de Controle para
-a memória, ela lê o endereço <tt>100</tt> pelo Barramento de Endereço e o
-valor <tt>30</tt> pelo Barramento de Dados e salva, então, o valor <tt>30</tt> no
-endereço <tt>100</tt>.</p></div>
-<div class="paragraph"><p>Com isso a operação é finalizada. Essa operação foi executada em
-aproximadamente 14 passos.
-Esse valor é aproximado porque alguns deles são apenas o envio de
-sinal para a memória, e isso geralmente é feito em paralelo com o
-passo seguinte.
-Se cada passo for executado dentro de uma batida do relógio (ou
-<strong>ciclo de clock</strong>), teremos 14 ciclos de clock para uma única instrução.
-Mas perceba que o acesso à memória é sempre mais lento do que a
-execução do processador.
-Se cada acesso à memória levar 3 ciclos de clock, teremos um total
-de 20 ciclos de clock.</p></div>
-<div class="admonitionblock">
-<table><tr>
-<td class="icon">
-<div class="title">Nota</div>
-</td>
-<td class="content">Apenas uma memória tipo Cache poderia ser acessada com apenas 3
-ciclos de clock.
-Uma memória principal convencional precisa de entre 10 e 15 ciclos
-de clock para ser lida. Depende de sua tecnologia (e preço!).</td>
-</tr></table>
-</div>
-<div class="paragraph"><p>Parece bastante, mas algumas instruções podem levar muito mais
-ciclos do que isso, como operações com Ponto Flutuante (números
-reais), ou de acesso a um periférico, como o disco rígido.
-Isso depende muito de como o projeto do computador é elaborado.</p></div>
-<div class="paragraph"><p>Apesar do computador parecer pouco efetivo na execução de uma
-simples soma, como ele executa numa frequência de clock muito alta,
-ele acaba executando muitas operações por segundo.
-Então, utilizar apenas a frequência de clock como medida de
-desempenho não é uma boa ideia.
-O mais utilizado é medir a quantidade de operações aritméticas
-que o processador é capaz de executar por segundo.
-Hoje em dia um computador pessoal está na escala dos alguns Milhões
-de Instruções por Segundo (ou MIPS).
-Mais a seguir vamos estudar como essas e outras medidas de desempenho
-podem ser calculadas.</p></div>
-<div class="admonitionblock">
-<table><tr>
-<td class="icon">
-<div class="title">Nota</div>
-</td>
-<td class="content">
-<div class="title">O que vem por aí</div>
-<div class="paragraph"><p>Até o momento vimos como um processador básico trabalha. Nas
-próximas seções deste capítulo vamos ver como o desempenho pode
-ser aumentado, ainda mais, aumentando adicionando técnicas avançadas de
-execução paralela e de análise de programas.</p></div>
-</td>
-</tr></table>
-</div>
-</div>
-<div class="sect2">
-<h3 id="sec_pipeline_desempenho">Aumentando o desempenho com Pipeline</h3>
-<div class="paragraph"><p></p></div>
-<div class="paragraph"><p>Pelo o que foi visto, até o momento, a execução de um programa é
-essencialmente sequencial, ou seja, uma instrução só é executada
-quando a anterior termina.
-Ao longo do nosso curso veremos que há dois modos de paralelismo que
-podem ser utilizados para melhorar ainda mais o desempenho do
-processador.
-O primeiro deles é através do chamado <strong>Paralelismo em Nível de
-Hardware</strong>, que é obtido quando replicamos unidades do processador
-para que elas funcionem em paralelo, reduzindo assim o tempo de
-execução dos programas.
-A segunda forma é através do <strong>Paralelismo em Nível de Instruções</strong>,
-ou ILP (do inglês, <em>Instruction Level Parallelism</em>).
-Nesse caso, as unidades do processador não são duplicadas, mas
-melhores organizadas para que não fiquem ociosas.
-Há duas formas principais de implementar o ILP,  uma delas é
-através do <strong>Pipeline</strong> e a outra é através de <strong>processadores
-Superescalares</strong>.
-Aqui vamos tratar do Pipeline, e no capítulo sobre Processamento
-Paralelo, vamos tratar as outras formas de paralelismo.</p></div>
-<div class="paragraph"><p>Imagine que possamos dividir o Ciclo de Instrução de um determinado
-processador nas cinco etapas seguintes:</p></div>
-<div class="dlist"><dl>
-<dt class="hdlist1">
-Carregar instrução (FI)
-</dt>
-<dd>
-<p>
-Traz a instrução da memória para o
-processador, armazena em IR (essa etapa também é chamada de <em>Fetch
-de Instrução</em>) e a decodifica para execução no passo seguinte.
-</p>
-</dd>
-<dt class="hdlist1">
-Carregar operandos (FO)
-</dt>
-<dd>
-<p>
-Traz os operandos da operação dos
-registradores para a ULA, para que a operação seja realizada sobre
-eles, também chamada de <em>Fetch de Operandos</em>.
-</p>
-</dd>
-<dt class="hdlist1">
-Executar instruções (EI)
-</dt>
-<dd>
-<p>
-Executa operação lógica ou aritmética
-propriamente dita.
-</p>
-</dd>
-<dt class="hdlist1">
-Escrever em memória (WM)
-</dt>
-<dd>
-<p>
-Escreve o resultado da operação em
-memória, se necessário.
-</p>
-</dd>
-<dt class="hdlist1">
-Escrever em registrador (WR)
-</dt>
-<dd>
-<p>
-Escreve o resultado da operação
-em um dos registradores, se necessário.
-</p>
-</dd>
-</dl></div>
-<div class="paragraph"><p>Esse é um dos Ciclos de Instrução mais simples que poderíamos
-imaginar, organizado em apenas 5 etapas.</p></div>
-<div class="admonitionblock">
-<table><tr>
-<td class="icon">
-<div class="title">Nota</div>
-</td>
-<td class="content">Processadores convencionais, como os da Intel que usamos em nossos
-computadores, executam instruções em cerca de 18 etapas.</td>
-</tr></table>
-</div>
-<div class="paragraph"><p>Cada instrução deve passar pelos cinco passos descritos para ser
-executada.
-Suponha que cada etapa necessite de apenas 1 ciclo de clock para ser
-executada.
-Quantos ciclos seriam necessários para executar um programa de 20
-instruções?
-Essa conta é simples.
-Cada instrução deve passar pelas cinco etapas, e cada etapa leva 1
-ciclo de clock, sendo assim, o programa levará 20 vezes 5 ciclos, ou
-seja, 100 ciclos de clock.</p></div>
-<div class="paragraph"><p>Agora vamos analisar o que acontece com cada etapa a medida em que o
-programa é executado.
-A primeira instrução vai passar pela etapa <strong>FI</strong>, que a leva para o IR
-e a decodifica.
-Em seguida ela é passada para a etapa <strong>FO</strong>, e os dados necessários
-para a operação são levados dos respectivos registradores para a ULA.
-Agora, observe.
-Neste exato momento, a segunda instrução do programa está parada
-na memória, aguardando sua vez para ser executada.
-Ao mesmo tempo, a etapa <strong>FI</strong> está ociosa.
-Por que a etapa FI não pode entrar em ação e trabalhar com a
-segunda instrução do programa, enquanto a primeira está na etapa FO?</p></div>
-<div class="paragraph"><p>O mesmo vai ocorrer com todas as etapas de execução da primeira
-instrução do programa.
-Ela vai ser executada na etapa <strong>EI</strong>, depois vai passar para a etapa
-<strong>WM</strong> que checará se há necessidade de copiar o resultado para a
-memória e, finalmente, para a <strong>WR</strong>, que copiará o resultado para um
-dos registradores.
-Quando a primeira instrução estiver na etapa <strong>WR</strong>, as etapas
-anteriores estarão todas ociosas.
-Por que não aproveitar o tempo ocioso para colocar as etapas
-anteriores para irem adiantando a execução das próximas
-instruções?
-É isso que propõe o Pipeline!</p></div>
-<div class="paragraph"><p>O Pipeline vai separar as etapas de execução de instruções em
-unidades físicas independentes, assim, uma etapa pode trabalhar com
-uma instrução, ao mesmo tempo em que uma outra unidade trabalha com
-uma outra instrução.
-É a mesma estratégia utilizada pela indústria de produção em
-massa para fabricar carros, por exemplo.
-Enquanto um chassi está sendo montado, outro está recebendo a
-carroceria, outro o motor, outro sendo pintado e outro recebendo o
-acabamento interno.
-Todas etapas trabalhando em paralelo e vários carros sendo tratados
-ao mesmo tempo.
-Esta estratégia aumenta o desempenho da execução das instruções
-de forma grandiosa.</p></div>
-<div class="paragraph"><p>Na <a href="#fig_pipeline">[fig_pipeline]</a> são apresentadas as adequações necessárias no
-processador para que as etapas possam ser organizadas em Pipeline.
-Dizemos então que esse processador trabalha com cinco Estágios de
-Pipeline.</p></div>
-<div class="imageblock" id="fig_pipeline">
-<div class="content">
-<img src="images/cap2/fig_pipeline.eps" alt="images/cap2/fig_pipeline.eps" />
-</div>
-<div class="title">Figura 12. Processador adaptado para trabalhar com Pipeline de cinco estágios</div>
-</div>
-<div class="paragraph"><p>A primeira mudança necessária é a separação da memória em duas
-partes independentes (ou duas memórias mesmo).
-Uma parte será utilizada apenas para instruções (representadas na
-figura pela palavra Fetch), e outra apenas para os dados
-(representada por DMem).
-Isso é necessário para que a etapa <strong>FI</strong> acesse a memória para buscar
-a próxima instrução, ao mesmo tempo em que a <strong>WM</strong> acessa a memória
-para salvar o resultado de outra instrução anterior.
-Se houvesse apenas uma memória para dados e instruções, isso não
-seria possível.
-Essa mudança vai contra o que foi projetado na ((Arquitetura de von
-Neumann)), e foi considerado um grande avanço.
-Ela foi batizada de Arquitetura Harvard.</p></div>
-<div class="paragraph"><p>Outra mudança importante foi a adição de memórias intermediárias
-entre cada etapa.
-Na <a href="#fig_pipeline">[fig_pipeline]</a> essas memórias são representadas pelos
-retângulos preenchidos e sem nenhuma palavra sobre eles.
-Essas memórias são utilizadas para armazenar o resultado da etapa
-anterior e passá-lo para a etapa posterior no ciclo seguinte.
-Elas são necessárias porque as etapas não executam necessariamente
-sempre na mesma velocidade.
-Se uma etapa for concluída antes da etapa seguinte, seu resultado
-deve ser guardado nessas memórias para aguardar que a etapa seguinte
-conclua o que estava fazendo.
-Só então ela poderá receber o resultado da etapa anterior.</p></div>
-<div class="paragraph"><p>O mesmo ocorre na produção de um carro.
-A etapa de instalação do motor pode ser mais rápida do que a de
-pintura, por exemplo.
-Então, se um carro acabou de receber um motor, ele deve ser guardado
-num local temporário até que o carro anterior tenha sua pintura
-concluída.
-Assim, a etapa de instalação do motor pode receber um novo carro.</p></div>
-<div class="paragraph"><p>Qual o benefício da execução em Pipeline?
-Para isso, vamos analisar a <a href="#fig_pipeline2">[fig_pipeline2]</a>.</p></div>
-<div class="imageblock" id="fig_pipeline2">
-<div class="content">
-<img src="images/cap2/fig_pipeline2.eps" alt="images/cap2/fig_pipeline2.eps" />
-</div>
-<div class="title">Figura 13. Execução em pipeline de cinco estágios</div>
-</div>
-<div class="paragraph"><p>Nesse exemplo a dimensão horizontal (eixo X) representa o tempo, e a
-dimensão vertical (eixo Y) representa as instruções a serem
-executadas (I1, I2, I3, I4 e I5).
-Nessa imagem, a instrução I1 já passou por todas as etapas e está
-em WR, enquanto isso, I2 está em WM, I3 está em EI, I4 está em FO
-e I5 ainda está em FI.
-Como o Pipeline possui 5 estágios, ele precisa, no mínimo, de 5
-instruções para encher o Pipeline e, a partir daí, inicia-se o
-ganho de desempenho.</p></div>
-<div class="paragraph"><p>Voltando ao exemplo anterior, considerando que cada etapa leve 1
-ciclo de clock para ser concluída.
-Quantos ciclos são necessários para executar 20 instruções agora
-com Pipeline?
-No início, o Pipeline não está cheio, então a instrução I1 deve
-passar por todas as 5 etapas para ser concluída, levando então 5
-ciclos de clock.
-Mas, a instrução I2 acompanhou I1 durante toda execução e
-terminou no ciclo seguinte, ou seja, em 6 ciclos de clock.
-Em seguida, a instrução I3 foi concluída em 7 ciclos de clock, I4
-em 8 ciclos, I5 em 9 ciclos, assim em diante, até a conclusão da
-vigésima instrução, que ocorreu em 24 ciclos.</p></div>
-<div class="paragraph"><p>Comparado com o exemplo sem Pipeline, que executou o mesmo programa
-em 100 ciclos, o ganho foi de 4,17 vezes.
-Se o programa tivesse 200 instruções, levaria 1000 ciclos de clock
-sem Pipeline e 204 ciclos com Pipeline, o resultaria num ganho de 4,9
-vezes.
-Onde queremos chegar com isso?</p></div>
-<div class="admonitionblock">
-<table><tr>
-<td class="icon">
-<div class="title">Importante</div>
-</td>
-<td class="content">A medida em que a quantidade de instruções aumenta, o ganho
-de desempenho com Pipeline vai se aproximando da quantidade de
-estágios, que foi 5 nesse exemplo.
-Então, quanto mais instruções forem executadas e mais estágios de
-Pipeline tiver o processador, maior será o benefício de usar o
-Pipeline.</td>
-</tr></table>
-</div>
-</div>
-<div class="sect2">
-<h3 id="_limitações_do_pipeline">Limitações do Pipeline</h3>
-<div class="paragraph"><p></p></div>
-<div class="paragraph"><p>Infelizmente, nem sempre o processador consegue usufruir do ganho
-máximo de desempenho ao usar o Pipeline.
-Há vários riscos que podem fazer com que o Pipeline seja
-interrompido e precise ser reiniciado, ou impossibilitado até de
-iniciar. Os riscos são:</p></div>
-<div class="ulist"><ul>
-<li>
-<p>
-Riscos Estruturais
-</p>
-</li>
-<li>
-<p>
-Riscos de Dados
-</p>
-</li>
-<li>
-<p>
-Riscos de Controle
-</p>
-</li>
-</ul></div>
-<div class="paragraph"><p>Os <strong>Riscos Estruturais</strong> são limitações físicas do processador.
-O exemplo mais simples é a separação da memória em Memória de
-Dados e Memória de Instruções.
-Se isso não ocorrer, as etapas de FI e WM não podem ser executadas
-ao mesmo tempo.</p></div>
-<div class="paragraph"><p>Já o <strong>Risco de Dados</strong> ocorre quando uma instrução depende do
-resultado de uma instrução anterior que está no Pipeline e ainda
-não está pronta.
-Imagine o trecho de programa a seguir:</p></div>
-<div class="listingblock">
-<div class="content">
-<pre><tt>I1: r1 = r2 + r3
-I2: r4 = r1 - r3</tt></pre>
-</div></div>
-<div class="paragraph"><p>A instrução I1 inicia primeiro e logo avança nas etapas do
-Pipeline.
-Logo depois dela vem I2.
-Quando I2 for buscar o valor de r1 na etapa FO, ele ainda não
-estará pronto, porque I1 ainda está em EI.
-A instrução I1 precisaria concluir a última etapa (WM) para que I2
-pudesse executar FO.
-Nesses casos, dizemos que há uma <em>Dependência de Dados</em>.
-Isso cria uma bolha no Pipeline, o processador tem que avançar I1
-até a conclusão de WM, e parar a execução de I2 e todas
-instruções seguintes até então.
-Só depois da conclusão de I1 é que o I2 e as próximas
-instruções seriam liberadas para continuar a execução.</p></div>
-<div class="paragraph"><p>O último tipo de risco é o <strong>Risco de Controle</strong>.
-Esse ocorre quando qualquer mudança no fluxo de controle do
-processador.
-Ou seja, quando a execução deixa de ser meramente sequencial.
-Como vimos anteriormente, o Pipeline vale a pena quando temos uma
-grande sequência de instruções sendo executadas.
-O processador confia que depois da instrução I1 ele executará a I2,
-depois a I3, e assim sucessivamente.
-Mas o que acontece, por exemplo, se o processador estiver executando
-a instrução I10, e essa instrução ordenar que o
-programa salte para a instrução I30?
-Isso pode ocorrer se a instrução se tratar de uma repetição, ou uma
-chamada a uma função.
-A mudança de controle também pode ocorrer por meio de
-interrupção, provocada por um dispositivo de entrada e saída, ou
-pelo pelo próprio Sistema Operacional, quando determina que um
-programa seja interrompido para passar a execução para um outro.
-Quando há uma mudança no fluxo de execução desta maneira, todas
-instruções que estão no Pipeline são removidas, o fluxo é
-modificado, e o Pipeline começa a ser preenchido todo novamente.</p></div>
-<div class="paragraph"><p>As técnicas de Pipeline avançaram bastante e várias medidas foram
-tomadas para amenizar o prejuízo causado pelos riscos mencionados.
-Entretanto, nenhuma técnica é capaz de evitar todas as possíveis
-perdas de desempenho.
-Até boas práticas de programação podem ajudar a otimizar a
-execução dos programas, e os compiladores também ajudam bastante
-neste aspecto.</p></div>
-<div class="paragraph"><p>Na próxima sessão vamos estudar um pouco como podemos realmente
-medir o desempenho dos processadores e entender melhor o que faz um
-processador mais eficiente do que outro.</p></div>
-<div class="admonitionblock">
-<table><tr>
-<td class="icon">
-<div class="title">Sugestão</div>
-</td>
-<td class="content">
-<div class="title">O desempenho dos computadores</div>
-<div class="paragraph"><p>O desempenho dos processadores e dos computadores é muito valorizado
-pelas empresas por agregarem muito valor a elas.
-Como se costuma dizer, tempo é dinheiro.
-Então quanto menos tempo se espera para um computador realizar uma
-tarefa, mais tempo resta para a empresa se dedicar a outras
-atividades.
-O desempenho é tão importante, que há uma corrida silenciosa entre
-empresas, universidades e governos para saber quem é capaz de
-produzir o computador mais rápido do mundo.
-A organização chamada Top 500 organiza uma competição para
-conhecer quem são esses campeões de desempenho e anualmente geral
-uma lista com os 500 computadores mais velozes.
-Atualmente a China e os Estados Unidos disputam o topo da lista do
-Top 500.
-Nas décadas após a Segunda Guerra Mundial os países disputavam uma
-guerra silenciosa (a Guerra Fria) para saber quem era o país mais
-poderoso em poder bélico e em tecnologias, como a corrida espacial.</p></div>
-<div class="paragraph"><p>Hoje a Guerra Fria já terminou, mas a corrida pela liderança
-tecnológica e econômica mundial continua e possui um novo
-concorrente forte disputando de igual para igual com os Estados
-Unidos, a China.
-Nessa corrida o poder computacional é importantíssimo!
-Ter um computador poderoso não significa apenas ser capaz de realizar
-tarefa mais rapidamente, mas ser também capaz de realizar certas
-tarefas que seriam impossíveis em computadores menos poderosos.
-Um exemplo disso é a construção de um computador que haja de forma
-semelhante ao cérebro humano.
-Chegar a esse ponto significa ser capaz de construir sistemas que
-possam substituir o homem em várias tarefas complexas, como dirigir
-máquinas e até mesmo operar computadores.
-Outro exemplo seria simular o comportamento perfeito da reação do
-corpo humano a drogas.
-Assim, não seria mais necessário o uso de cobaias para testar
-medicamentos.
-Esse avanço traria um poder incalculável a quem o dominasse!</p></div>
-<div class="paragraph"><p>Acesse o site da Top 500 em <a href="http://www.top500.org">http://www.top500.org</a> e conheça as super
-máquinas da computação!</p></div>
-</td>
-</tr></table>
-</div>
-<div class="sect3">
-<h4 id="_medidas_de_desempenho">Medidas de desempenho</h4>
-<div class="paragraph"><p></p></div>
-<div class="paragraph"><p>Para medir o desempenho dos computadores, três métricas principais
-são mais usadas:</p></div>
-<div class="dlist"><dl>
-<dt class="hdlist1">
-Ciclos de Clock por Instrução (CPI)
-</dt>
-<dd>
-<p>
-determina quantos ciclos de
-clock são necessários para executar uma determinada instrução.
-Vimos que o Ciclo de Instrução é organizado em várias etapas e
-que isso depende de instrução para instrução.
-Se uma instrução acessar mais memória do que outra, ela será mais
-lenta.
-Instruções que operam com Pontos Flutuantes são mais lentas do que
-as operações com números inteiros.
-É fácil perceber a razão disso.
-Operações com números reais são mais complexas de serem
-resolvidas, porque devem ser realizadas para a parte fracionária e
-para a inteira, e depois o resultado deve ser consolidado.
-Assim, simulações são realizadas com um processador e são
-calculados quantos ciclos de clock cada tipo de instrução necessita
-em média para ser completada.
-Este é o CPI!
-</p>
-</dd>
-<dt class="hdlist1">
-Milhões de Instruções por Segundo (MIPS)
-</dt>
-<dd>
-<p>
-o CPI é uma medida
-utilizada para medir o desempenho do processador para cada tipo de
-instrução, mas não é muito boa para medir o desempenho para a
-execução de programas, que é o objetivo de todo computador.
-Isso porque os programas são geralmente formados por instruções de
-todos os tipos, com inteiros, ponto flutuante, acessando muita ou
-pouca memória.
-Outro fator é que fatores como, Pipeline, tecnologia de memória e
-tamanho da memória Cache, podem fazer com que uma instrução seja
-executada lenta agora, e rápida logo em seguida.
-Para contornar isso, uma métrica muito utilizada é o MIPS.
-Ela determina quantos Milhões de Instruções são executadas pelo
-computador a cada segundo.
-Nesse caso, programas que demandam muito esforço do computador são
-executados, a quantidade de instruções é contada e depois dividida
-pela quantidade de segundos da execução.
-Caso o CPI médio (também chamado de CPI Efetivo) do computador já
-tenha sido calculado anteriormente, o MIPS pode ser calculado pela
-fórmula:
-</p>
-</dd>
-</dl></div>
-<div class="mathblock">
-<div class="content">\[
-\begin{array}{ccl}
-MIPS&=& \frac{Clock}{CPI * M}
-\end{array}
-\]</div></div>
-<div class="paragraph"><p>Onde, <tt>Clock</tt> é a frequência do relógio do processador em Hertz, <tt>CPI</tt>
-é o CPI médio e <tt>M</tt> é um milhão ($10^{6}$).
-É necessário dividir o resultado por <tt>M</tt> porque a medida do MIPS é
-sempre dada na escala de milhões.
-Por exemplo, se um processador de 2 GHz e CPI médio de 4 ciclos por
-instrução, o MIPS desse processador será:</p></div>
-<div class="mathblock">
-<div class="content">\[
-\begin{array}{ccl}
-MIPS&=& \frac{2G}{4 * M}
-\end{array}
-\]</div></div>
-<div class="paragraph"><p>O resultado dessa operação será 0,5M, ou 500K.
-Isso porque 2 dividido por 4 é 0,5, e 1 Giga dividido por 1 Mega,
-resulta em 1 Mega.</p></div>
-<div class="admonitionblock">
-<table><tr>
-<td class="icon">
-<div class="title">Nota</div>
-</td>
-<td class="content">Lembre-se sempre de considerar a grandeza do Clock no cálculo. Um
-giga Hertz é muito diferente de um kilo, ou um mega Hertz!</td>
-</tr></table>
-</div>
-<div class="dlist"><dl>
-<dt class="hdlist1">
-Milhões de Instruções em Ponto Flutuante por Segundo (MFLOPS)
-</dt>
-<dd>
-<p>
-uma alternativa para o MIPS é o MFLOPS.
-O MIPS é muito eficiente, mas não para comparar programas
-diferentes.
-</p>
-</dd>
-</dl></div>
-<div class="paragraph"><p>Para calcular o MFLOPS, são executadas apenas instruções que
-operam com Ponto Flutuante e são calculados quantos segundos se
-passaram para cada milhão delas.
-Assim, ela pode ser definida da seguinte forma:</p></div>
-<div class="mathblock">
-<div class="content">\[
-\begin{array}{ccl}
-MFLOPS&=& \frac{Clock}{CPI_{f} * M}
-\end{array}
-\]</div></div>
-<div class="paragraph"><p>A única diferença para o cálculo do MIPS é que apenas as
-instruções que operam com Ponto Flutuante são consideradas.
-Assim, CPI_{f} diz respeito a quantos ciclos de clock em
-média são necessários para executar uma instrução de ponto
-flutuante.</p></div>
-<div class="paragraph"><p>Os computadores pessoais e comerciais de hoje trabalham na escala
-MFLOPS.</p></div>
-<div class="paragraph"><p>Já os supercomputadores trabalham na escala de GFLOPS (Giga FLOPS).
-Aqueles computadores que lideram a lista do Top 500, e são capazes
-até de mudar o PIB de um país, trabalham na escala do TFLOPS (Teta
-FLOPS).</p></div>
-</div>
-<div class="sect3">
-<h4 id="_exemplos_de_calcular_o_desempenho_de_um_processador">Exemplos de calcular o desempenho de um processador</h4>
-<div class="paragraph"><p>Suponha que um programa é executado num processador de 40MHz. A
-<a href="#tabela_exercicio1">[tabela_exercicio1]</a> apresenta os CPIs coletados para cada tipo de
-instrução, bem como sua quantidade de instruções para um
-determinado programa com 100.000 instruções.</p></div>
-<div class="tableblock" id="tabela_exercicio1">
-<table rules="all"
-width="90%"
-frame="void"
-cellspacing="0" cellpadding="4">
-<caption class="title">Tabela 1. Exemplo de configuração de um processador</caption>
-<col width="50%" />
-<col width="16%" />
-<col width="33%" />
-<thead>
-<tr>
-<th align="center" valign="top"> Tipo de instrução </th>
-<th align="center" valign="top"> CPI </th>
-<th align="center" valign="top"> Número de instruções</th>
-</tr>
-</thead>
-<tbody>
-<tr>
-<td align="center" valign="top"><p class="table">Aritmética com Inteiros</p></td>
-<td align="center" valign="top"><p class="table">1</p></td>
-<td align="center" valign="top"><p class="table">45.000</p></td>
-</tr>
-<tr>
-<td align="center" valign="top"><p class="table">Operações de acesso à Memória</p></td>
-<td align="center" valign="top"><p class="table">4</p></td>
-<td align="center" valign="top"><p class="table">32.000</p></td>
-</tr>
-<tr>
-<td align="center" valign="top"><p class="table">Operações com Ponto Flutuante</p></td>
-<td align="center" valign="top"><p class="table">2</p></td>
-<td align="center" valign="top"><p class="table">15.000</p></td>
-</tr>
-<tr>
-<td align="center" valign="top"><p class="table">Instruções de salto e desvio</p></td>
-<td align="center" valign="top"><p class="table">5</p></td>
-<td align="center" valign="top"><p class="table">8.000</p></td>
-</tr>
-</tbody>
-</table>
-</div>
-<div class="paragraph"><p>Para este exemplo, vamos calcular o CPI efetivo, o MIPS e o MFLOPS.</p></div>
-<div class="paragraph"><p>O CPI Efetivo é simplesmente a média ponderada dos CPIs
-apresentados para o programa. Isso pode ser feito da seguinte forma:</p></div>
-<div class="mathblock">
-<div class="content">\[
-\begin{array}{ccl}
-CPI&=& \frac{(1*45000) + (4*32000) + (2*15000) + (5*8000)}{(45000) +
-(32000) + (15000) + (8000)} \\
-\\
-CPI&=& \frac{45000 + 128000 + 30000 + 40000}{100000} \\
-\\
-CPI&=& \frac{243000}{100000} \\
-\\
-CPI&=& 2,43
-\end{array}
-\]</div></div>
-<div class="paragraph"><p>Já o MIPS pode ser calculado como:</p></div>
-<div class="mathblock">
-<div class="content">\[
-\begin{array}{ccl}
-MIPS&=& \frac{Clock}{CPI * M} \\
-\\
-MIPS&=& \frac{40M}{2,43 * M} \\
-\\
-MIPS&=& 16,46
-\end{array}
-\]</div></div>
-<div class="paragraph"><p>Ou seja, para o programa examinado, o processador teve um desempenho
-de 16,46 milhões de instruções por segundo.
-Se o objetivo for calcular o MIPS geral, e não específico para esse
-programa, deve-se utilizar a média aritmética de todos os CPI
-calculados, e não a média ponderada.</p></div>
-<div class="paragraph"><p>Para calcular o MFLOPS seguimos a mesma estratégia, mas dessa vez
-utilizamos apenas o CPI para instruções de ponto flutuante.
-Ou seja:</p></div>
-<div class="mathblock">
-<div class="content">\[
-\begin{array}{ccl}
-MFLOPS&=& \frac{Clock}{CPI_{f} * M} \\
-\\
-MFLOPS&=& \frac{40M}{2 * M} \\
-\\
-MFLOPS&=& 20
-\end{array}
-\]</div></div>
-<div class="paragraph"><p>Isso significa que esse processador apresentou um desempenho de 20
-milhões de instruções de ponto flutuante por segundo.</p></div>
-</div>
-</div>
-<div class="sect2">
-<h3 id="_recapitulando_2">Recapitulando</h3>
-<div class="paragraph"><p>Vimos em mais detalhe neste capítulo como os processadores executam
-nossos programas, e como alguns aspectos de organização e
-arquitetura são importantes.
-Não apenas a frequência do clock do processador é relevante, mas
-como o Pipeline é aplicado, se há muitas interrupções e se o
-programa é bem escrito a ponto de explorar melhor o Pipeline.
-Também foram apresentados três diferentes métricas para se avaliar
-o desempenho de um sistema, o CPI, o MIPS e o MFLOPS.</p></div>
-<div class="paragraph"><p>No próximo capítulo vamos estudar mais profundamente a CPU através
-do estudo de sua Unidade de Controle e como ela faz para decodificar
-e executar instruções.</p></div>
-</div>
-</div>
-</div>
-<div class="sect1">
-<h2 id="_unidade_de_controle">Unidade de Controle</h2>
-<div class="sectionbody">
-<div class="quoteblock">
-<div class="title">Objetivos do capítulo</div>
-<div class="content">
-<div class="paragraph"><p>Ao final deste capítulo você deverá ser capaz de:</p></div>
-<div class="ulist"><ul>
-<li>
-<p>
-Conhecer o funcionamento da Unidade de Controle em mais detalhes
-</p>
-</li>
-<li>
-<p>
-Apresentar como as instruções são executadas pela CPU
-</p>
-</li>
-</ul></div>
-</div>
-<div class="attribution">
-</div></div>
-<div class="paragraph"><p>Neste capítulo vamos entrar mais a fundo no estudo das CPUs e vamos
-apresentar a Unidade de Controle, principal unidade dos
-processadores. Conhecer a Unidade de Controle é essencial para o
-entendimento de como as instruções são executadas pelo computador.</p></div>
-<div class="sect2">
-<h3 id="_introdução_2">Introdução</h3>
-<div class="paragraph"><p>A Unidade de Controle, como visto no capítulo anterior, é a unidade
-interna à CPU responsável (como o próprio nome já diz) pelo
-controle da execução das instruções.
-Como a CPU é uma máquina de executar instruções, a Unidade de
-Controle é quem controla o principal funcionamento do computador.</p></div>
-<div class="paragraph"><p>O projeto de uma Unidade de Controle varia de arquitetura para
-arquitetura, mas há alguns pontos que são comuns a todas elas. Toda
-Unidade de Controle trabalha com a execução de Microoperações.
-Como pode ser visto na <a href="#fig_execucao">[fig_execucao]</a>, um programa é sempre
-executado instrução por instrução. Essas seriam instruções de
-máquina, compiladas a partir de Assembly, ou antes a partir de uma
-linguagem de alto nível e depois compiladas para Assembly.
-Cada instrução é executada através de um Ciclo de Instrução,
-como visto no capítulo anterior.
-Nessa ilustração o ciclo de instrução foi apresentado em cinco
-estágios (Carrega instrução, decodifica, executa, salva resultados
-e checa interrupção).
-Mas ele pode variar de acordo com a arquitetura da Unidade de
-Controle e também de acordo com o tipo de instrução.
-Uma instrução com vários parâmetros que estão na memória, por
-exemplo, pode necessitar de um estágio a mais antes da execução
-para buscar os dados na memória.
-Já outra que utiliza apenas dados de registradores pode omitir esse
-passo e executá-lo no próprio estágio de execução.</p></div>
-<div class="imageblock" id="fig_execucao">
-<div class="content">
-<img src="images/cap3/fig_execucao.eps" alt="images/cap3/fig_execucao.eps" />
-</div>
-<div class="title">Figura 14. Execução em Microoperações</div>
-</div>
-</div>
-<div class="sect2">
-<h3 id="_microoperações">Microoperações</h3>
-<div class="paragraph"><p>Ainda na <a href="#fig_execucao">[fig_execucao]</a> pode ser visto que cada estágio do Ciclo
-de Instrução é quebrado em sub-estágios, chamados de
-Microoperações.
-A Microoperação é a operação atômica (indivisível) realizada
-pela Unidade de Controle para a execução de cada estágio.
-Cada vez que um estágio do Ciclo de Instrução for executado, as
-devidas Microoperações são executadas pela Unidade de Controle.</p></div>
-<div class="paragraph"><p>Essa organização é necessária para melhorar a organização da
-CPU e facilitar o projeto das Unidades de Controle.
-Além disso, nos projetos de Unidades de Controle modernas, é
-possível reutilizar Microoperações de um estágio em outro.
-Por exemplo, para executar uma instrução, é necessário executar
-uma Microoperação para buscar um dado que está em um registrador
-(ou memória) para a ULA.
-Se houver vários dados envolvidos, a única tarefa a ser realizada
-é pedir para a Unidade de Controle executar a mesma Microoperação
-de buscar dado, mas agora com endereço diferente.</p></div>
-<div class="paragraph"><p>Dessa maneira, todas instruções que chegam à Unidade de Controle
-são quebradas em estágios (lembre-se do Pipeline), que por sua vez,
-separados em sequências de Microoperações e, só então, são
-executadas.
-Agora vamos apresentar alguns exemplos de como os principais
-estágios de execução são organizados em Microoperações.</p></div>
-<div class="sect3">
-<h4 id="_busca_de_instrução">Busca de Instrução</h4>
-<div class="paragraph"><p>Neste estágio uma nova instrução deve ser buscada da memória e
-trazida para a CPU para que possa ser decodificada e executada em
-seguida.
-O endereço da instrução a ser buscada está sempre no Contador de
-Programa (PC) e a instrução buscada da memória é armazenada no
-Registrador de Instrução (IR).
-Vamos então apresentar como seriam as Microoperações para realizar
-a Busca de Instrução.</p></div>
-<div class="paragraph"><p>A seguir cada Microoperação é apresentada ao lado de uma
-determinação do tempo em que ela será realizada.
-Nesse caso, três unidades de tempo são necessárias (t1, t2 e t3).
-Imagine que cada unidade de tempo é 1 ciclo de clock (as
-microoperações mais complexas levam mais tempo do que isso).</p></div>
-<div class="listingblock">
-<div class="content">
-<pre><tt>t1:     MAR &lt;- (PC)
-        Memória &lt;- fetch;
-t2:     MBR &lt;- (memória)
-        PC &lt;- (PC) + 1
-t3:     IR &lt;- (MBR)</tt></pre>
-</div></div>
-<div class="paragraph"><p>No tempo t1 o endereço guardado no registrador PC é copiado para o
-registrador MAR, que é o registrador conectado ao Barramento de
-Endereço.
-Ao mesmo tempo, a CPU envia para a memória um sinal de “fetch”,
-indicando que precisa ser trazida uma nova instrução.
-No tempo t2 a memória lê o endereço contigo no Barramento de
-Endereço (que é sempre o mesmo de MAR), busca a instrução e a
-escreve no Barramento de Dados.
-Como o MBR sempre reflete aquilo que está no Barramento de Dados, o
-MBR agora contém a instrução trazida da memória.
-Esta tarefa é realizada essencialmente pela memória, a ULA está
-livre para executar outra Microoperação, e aproveita para adicionar
-1 ao endereço do PC.
-Esta operação de incremento vai garantir que a próxima instrução
-a ser buscada será a do endereço seguinte da memória.
-Finalmente, no tempo t3, a instrução que foi trazida da memória e
-salva em MBR pode ser agora salva em IR.</p></div>
-<div class="paragraph"><p>A instrução precisa sempre estar em IR porque na faze de
-decodificarão, a Unidade de Controle vai buscar lá que instrução
-deve executar.</p></div>
-<div class="paragraph"><p>Observe que a mesma Microoperação poderia ser executada de forma
-diferente, como mostrada a seguir.</p></div>
-<div class="listingblock">
-<div class="content">
-<pre><tt>t1:     MAR &lt;- (PC)
-        Memória &lt;- fetch;
-t2:     MBR &lt;- (memória)
-t3:     PC &lt;- (PC) +1
-        IR &lt;- (MBR)</tt></pre>
-</div></div>
-<div class="paragraph"><p>Nesta segunda opção, o incremento de PC foi passado para o tempo
-t3, ao invés de t2, o que gera o mesmo resultado.</p></div>
-<div class="paragraph"><p>A quantidade de Microoperações que podem ser executadas no mesmo
-ciclo de clock depende da arquitetura do processador.
-Por exemplo, se há apenas uma ULA, então só é possível executar
-uma única operação lógica, ou aritmética a cada ciclo de clock.
-O mesmo serve para o uso acesso à memória com MAR e MBR. Se houver
-um barramento exclusivo para instruções, separado do barramento de
-dados e uma memória de instrução separada da memória de dados
-(quase todos processadores hoje possuem), e então é possível
-buscar uma instrução no mesmo ciclo de clock que se busca um dado.</p></div>
-</div>
-<div class="sect3">
-<h4 id="_busca_indireta">Busca indireta</h4>
-<div class="paragraph"><p>Outro tipo de Microoperação muito utilizado é a Busca Indireta.
-Ela trata de buscar um dado que está na memória e trazer para a CPU
-para ser utilizado pela instrução.
-O termo “indireta” indica que o dado não está diretamente na
-CPU (em um registrador) mas na memória.</p></div>
-<div class="paragraph"><p>Imagine que a instrução em questão seja a soma de 2 números A e
-B, ambos na memória.
-Esta instrução foi buscada no estágio anterior, portanto no ciclo
-seguinte ela estará no registrador IR.
-Então, os endereços de A e B estão presentes na instrução que
-agora está em IR.
-A Busca Indireta deve então ser realizada para A e depois para B, da
-seguinte forma:</p></div>
-<div class="listingblock">
-<div class="content">
-<pre><tt>t1:     MAR &lt;- (IRendereco)
-        Memória &lt;- read
-t2:     MBR &lt;- (memória)
-t3:     ACC &lt;- (MBR)</tt></pre>
-</div></div>
-<div class="paragraph"><p>No primeiro instante t1 o endereço do dado contido em IR é passado
-para o registrador de endereço MAR.
-Ao mesmo tempo a CPU envia para a memória um sinal de leitura
-(read), avisando que deve ser feita uma busca indireta.
-No instante seguinte, t2, o conteúdo do dado é trazido da memória
-para o MBR através do Barramento de Dados, e no último passo, em
-t3, o conteúdo agora em MBR é levado para um registrador para que
-seja utilizado na operação, geralmente o Acumulador (ACC).</p></div>
-</div>
-<div class="sect3">
-<h4 id="_execução">Execução</h4>
-<div class="paragraph"><p>Após a busca da instrução e dos dados necessários, é hora de
-executar a instrução na Microoperação de execução.
-Mantendo o exemplo da soma A e B apresentado anteriormente, a Unidade
-de Controle terá que fazer a Busca Indireta de A e B para depois
-realizar a soma.
-Supondo que A seja salvo em ACC, ele deve ser transferido para outro
-registrador, digamos R1 antes de Busca Indireta por B.
-Assim, a execução seria:</p></div>
-<div class="listingblock">
-<div class="content">
-<pre><tt>t1:     R1 &lt;- ACC
-// Busca indireta por B:
-t2:     MAR &lt;- (IRendereco)
-        Memória &lt;- read
-t3:     MBR &lt;- (memória)
-t4:     ACC &lt;- MBR
-t5:     ACC = R1 + ACC</tt></pre>
-</div></div>
-<div class="paragraph"><p>Em t1 o conteúdo de A salvo em ACC será transferido para o
-registrador R1.
-Nos intervalos de t2 até t4 seria feita a Busca Indireta por B.
-E, finalmente, no instante t5 a soma de R1 e ACC seria realizada e
-salva no acumulador ACC.</p></div>
-</div>
-<div class="sect3">
-<h4 id="_salvar_resultado">Salvar resultado</h4>
-<div class="paragraph"><p>Após esse último passo, o conteúdo de ACC com o resultado da
-operação deve ser transferido para o local de destino.
-Isso é feito no estágio de Salvar Resultado.
-Se o resultado for salvo num registrador, a operação é direta e
-feita num único ciclo de clock.
-Mas se precisar salvar o resultado na memória, uma escrita indireta
-deverá ser realizada para salvar o conteúdo de ACC na memória.</p></div>
-<div class="listingblock">
-<div class="content">
-<pre><tt>t1:     MAR &lt;- (IRendereco)
-t2:     MBR &lt;- ACC
-        Memória &lt;- write</tt></pre>
-</div></div>
-<div class="paragraph"><p>Para tal, inicialmente em t1 o endereço da variável de memória que
-precisa ser salva é passado para o MAR.
-O conteúdo de ACC é passado para o MBR no ciclo seguinte (t2), ao
-mesmo tempo em que a CPU envia para a memória um sinal de escrita.
-Ao receber esse sinal, a memória traz o conteúdo de MBR e o salva
-no endereço representado por MAR.</p></div>
-</div>
-<div class="sect3">
-<h4 id="_salto_condicional">Salto condicional</h4>
-<div class="paragraph"><p>Uma instrução muito comum executada pelos computadores são os
-saltos condicionais.
-Ela indica que se uma determinada condição for satisfeita, a
-execução não deve ser a da instrução seguinte, mas a indicada
-pela instrução.
-Imagine uma instrução “Salta se zero”, com dois parâmetros, X
-e Y.
-O X seria a variável a ser testada e o Y o endereço para onde a
-execução deve saltar caso o valor de X seja 0.</p></div>
-<div class="paragraph"><p>Desta forma, as microoperações seriam as seguinte:</p></div>
-<div class="listingblock">
-<div class="content">
-<pre><tt>// Busca indireta por X:
-t1:     MAR &lt;- (IRenderecoX)
-        Memória &lt;- read
-t2:     MBR &lt;- (Memória)
-t3:     ACC &lt;- (MBR)
-
-t4:     se ACC == 0, PC = (IRenderecoY)</tt></pre>
-</div></div>
-<div class="paragraph"><p>Inicialmente, de t1 a t3, seria buscado o conteúdo de X na memória.
-No último ciclo t4, o conteúdo de ACC seria comparado com 0 e se
-forem iguais, o conteúdo de PC será o endereço da variável Y,
-também presente em IR.
-Observe que, caso contrário, nada precisa ser feito, o PC
-continuará como antes e a próxima instrução depois da atual será
-executada.</p></div>
-</div>
-</div>
-<div class="sect2">
-<h3 id="_tipos_de_microoperações">Tipos de Microoperações</h3>
-<div class="paragraph"><p>Como já foi possível observar através dos exemplos apresentados,
-há quatro tipos básicos de Microoperações de uma Unidade de
-Controle. São eles:</p></div>
-<div class="ulist"><ul>
-<li>
-<p>
-Transferência de dados entre registradores
-</p>
-</li>
-<li>
-<p>
-Transferência de dados de registrador para o exterior da CPU
-</p>
-</li>
-<li>
-<p>
-Transferência de dados do exterior da CPU para um registrador
-</p>
-</li>
-<li>
-<p>
-Operação lógica e aritmética
-</p>
-</li>
-</ul></div>
-<div class="paragraph"><p>A transferência de dados de um registrador para outro é a mais
-simples das Microoperações e geralmente é feita num único ciclo
-de clock.
-Já a movimentação de dados de ou para o exterior da CPU pode ser
-mais complexa.
-Para facilitar muitos computadores mapeiam todos dispositivos de
-Entrada e Saída com se fossem memória.
-Ou seja, para a CPU, enviar um dado para um dispositivo seria como
-escrever um dado na memória, bastando usar um endereço diferente.
-Isso facilita bastante a operação da Unidade de Controle, mas pode
-limitar a quantidade de endereços de memória disponíveis para os
-programas.
-As operações de transferência de dados são complexas também
-porque levam um tempo não conhecido para serem executadas.
-Se o dado estiver na memória Cache o acesso é mais rápido, se
-estiver na Memória Principal levará mais tempo, e se tiver num
-dispositivo externo, um Disco Rígido, por exemplo, pode levar ainda
-mais.</p></div>
-<div class="paragraph"><p>As operações lógica e aritméticas podem ser mais rápidas ou mais
-lentas dependendo de cada uma delas.
-Operações com números de Ponto Flutuante tendem a levar mais tempo
-do que aquelas com números inteiros.
-Já as operações trigonométricas são as mais lentas que o
-computador pode operar.</p></div>
-</div>
-<div class="sect2">
-<h3 id="_decodificação">Decodificação</h3>
-<div class="paragraph"><p>A execução das Microoperações é sempre ordenada pela Unidade de
-Controle.
-Isso é feito no estágio de Decodificação, a partir da leitura da
-instrução presente em IR.
-O primeiro da decodificarão é ler o código da instrução para
-conhecer seu tipo.
-Dependendo do tipo, a instrução é quebrada numa quantidade
-específica de Estágios e cada estágio no seu respectivo grupo de
-Microoperações.
-Cada vez uma que Microoperação se encerra, a Unidade de Controle
-checa qual será a próxima e envia os sinais para os devidos
-registradores, para ULA e dispositivos envolvidos, como memória ou
-dispositivos de Entrada e Saída.</p></div>
-<div class="paragraph"><p>Dessa forma, podemos dizer que a Unidade de Controle possui duas
-funções principais, a execução e o sequenciamento das
-instruções.
-Nessa última função a Unidade de Controle deve saber o exato
-momento que uma Microoperação concluiu para executar a próxima, e
-quando a última Microoperação for executada, iniciar um novo
-Estágio, e quando o último Estágio for concluído, executar a
-próxima instrução do programa.</p></div>
-</div>
-<div class="sect2">
-<h3 id="_exemplo">Exemplo</h3>
-<div class="paragraph"><p>Como exemplo, vamos visualizar como seria a execução de um pequeno
-programa na forma de microoperações.
-Para tal, considere um processador que executa suas instruções em
-cinco estágios de execução:</p></div>
-<div class="ulist"><ul>
-<li>
-<p>
-Busca de Instrução
-</p>
-</li>
-<li>
-<p>
-Decodifica Instrução
-</p>
-</li>
-<li>
-<p>
-Busca de Dados
-</p>
-</li>
-<li>
-<p>
-Executa Instrução
-</p>
-</li>
-<li>
-<p>
-Salva Resultados
-</p>
-</li>
-</ul></div>
-<div class="paragraph"><p>Cada instrução do programa é decomposta em microoperações que
-são executadas, geralmente, uma a cada ciclo de clock.</p></div>
-<div class="paragraph"><p>Sendo, assim, suponha que o programa a ser executado está na
-memória de acordo com a <a href="#tabela_exemplo">[tabela_exemplo]</a> a seguir.
-Cada instrução fica armazenada em um endereço de memória, assim
-como as variáveis envolvidas.</p></div>
-<div class="tableblock" id="tabela_exemplo">
-<table rules="all"
-width="90%"
-frame="void"
-cellspacing="0" cellpadding="4">
-<caption class="title">Tabela 2. Exemplo de um programa de duas instruções armazenado na memória</caption>
-<col width="33%" />
-<col width="66%" />
-<thead>
-<tr>
-<th align="center" valign="top"> Endereço </th>
-<th align="center" valign="top"> Instrução ou Dado</th>
-</tr>
-</thead>
-<tbody>
-<tr>
-<td align="center" valign="top"><p class="table">FF01</p></td>
-<td align="center" valign="top"><p class="table">A = B * C</p></td>
-</tr>
-<tr>
-<td align="center" valign="top"><p class="table">FF02</p></td>
-<td align="center" valign="top"><p class="table">B = A + 2</p></td>
-</tr>
-<tr>
-<td align="center" valign="top"><p class="table">FF03</p></td>
-<td align="center" valign="top"><p class="table">15  // valor de A</p></td>
-</tr>
-<tr>
-<td align="center" valign="top"><p class="table">FF04</p></td>
-<td align="center" valign="top"><p class="table">2  // valor de B</p></td>
-</tr>
-<tr>
-<td align="center" valign="top"><p class="table">FF05</p></td>
-<td align="center" valign="top"><p class="table">4  // valor de C</p></td>
-</tr>
-</tbody>
-</table>
-</div>
-<div class="paragraph"><p>A seguir serão apresentadas as microoperações executadas para a
-primeira instrução.</p></div>
-<div class="sect3">
-<h4 id="_busca_de_instrução_2">Busca de Instrução</h4>
-<div class="paragraph"><p>Para que esse programa seja executado, é necessário que o
-registrador PC contenha o endereço FF01 para que a primeira
-instrução do nosso programa nessa buscada e executa.
-O início de execução de um programa é causado por uma ação do
-usuário (quando ele clica no ícone de um programa, por exemplo),
-pelo Sistema Operacional ou um por um outro programa.</p></div>
-<div class="paragraph"><p>Uma vez que o PC tenha o endereço FF01, na próxima instrução a
-ser buscada, a Unidade de Controle irá executar as seguintes
-instruções:</p></div>
-<div class="listingblock">
-<div class="content">
-<pre><tt>t1:     MAR &lt;- PC
-        Memória &lt;- fetch;
-t2:     MBR &lt;- ‘A = B * C’
-        PC &lt;- PC + 1
-t3:     IR &lt;- MBR</tt></pre>
-</div></div>
-<div class="paragraph"><p>Neste exemplo, no tempo t1, MAR recebeu o endereço contido em PC, ou
-seja, FF01.
-Nesse mesmo instante, a Unidade de Controle envia o sinal ‘fetch’
-para memória, que por sua vez, passa o conteúdo do endereço FF01
-para o registrador MBR no instante t2 seguinte.
-Aproveitando o tempo, enquanto o conteúdo da memória era trazido
-para o MBR, a Unidade de Controle incrementou o endereço de PC para
-FF02.
-Só no tempo t3 a instrução está pronta em MBR e é então copiada
-para IR para que possa ser Decodificada na próxima microoperação.</p></div>
-</div>
-<div class="sect3">
-<h4 id="_decodificação_2">Decodificação</h4>
-<div class="paragraph"><p>Durante a decodificação não são executadas Microoperações.
-A instrução que acabou de ser copiada para IR é analisada e a
-Unidade de Controle vai então escolher que Microoperações serão
-executadas nas etapas seguintes.</p></div>
-</div>
-<div class="sect3">
-<h4 id="_busca_de_dados_2">Busca de Dados</h4>
-<div class="paragraph"><p>Nas próximas etapas, será necessário buscar os dados necessários
-para a execução da instrução.
-Como os dados envolvidos (B e C) estão na memória, e não em
-registradores, serão necessárias duas Buscas Indiretas.
-A instrução na verdade nunca chega como sendo ‘A = B * C’.
-Ao invés disso, ela seria armazenada como ‘(FF03) = (FF04) *
-(FF05).
-Por questões didáticas, utilizamos ainda as variáveis A, B e C.</p></div>
-<div class="paragraph"><p>Para buscar o conteúdo da variável B, as seguintes Microoperações
-são executadas.</p></div>
-<div class="paragraph"><p>Na etapa de Decodificação, a instr</p></div>
-<div class="listingblock">
-<div class="content">
-<pre><tt>t4:     MAR &lt;- (FF04)
-        Memória &lt;- read
-t5:     MBR &lt;- 2
-t6:     ACC &lt;- MBR</tt></pre>
-</div></div>
-<div class="paragraph"><p>Aqui, o endereço FF04 é passado para o MAR para que seja buscado na
-memória no tempo t4, em seguida é enviado um sinal de leitura para
-a memória.
-Ao receber o sinal de leitura, a memória busca o conteúdo do
-endereço FF04 e o copia para dentro da CPU, no registrador MBR no
-instante t5.
-Finalmente, no tempo t6, o conteúdo de MBR (valor 2) é copiado para
-o registrador acumulador (ACC).</p></div>
-<div class="admonitionblock">
-<table><tr>
-<td class="icon">
-<div class="title">Nota</div>
-</td>
-<td class="content">Note que usamos sempre parêntesis para indicar que se trata de
-um endereço, e sem os parêntesis quando se trata de um dado.</td>
-</tr></table>
-</div>
-<div class="paragraph"><p>O próximo passo seria buscar o conteúdo da variável C de forma
-análoga a utilizada para buscar B.</p></div>
-<div class="listingblock">
-<div class="content">
-<pre><tt>t7:     MAR &lt;- (FF05)
-        Memória &lt;- read
-t8:     MBR &lt;- 4
-t9:     R1 &lt;- MBR</tt></pre>
-</div></div>
-<div class="paragraph"><p>Perceba que na última Microoperação o conteúdo de C foi copiado
-para R1, para não sobreescrever e perder o conteúdo da variável B
-que foi armazenado em ACC.</p></div>
-</div>
-<div class="sect3">
-<h4 id="_execução_2">Execução</h4>
-<div class="paragraph"><p>No próximo passo, a instrução precisa ser executada.
-Isso é feito em um único passo no tempo t10, onde ACC, que agora
-mantém o conteúdo da variável B é multiplicado por R1, que possui
-o conteúdo da variável C.</p></div>
-<div class="listingblock">
-<div class="content">
-<pre><tt>t10:     ACC &lt;- ACC * R1</tt></pre>
-</div></div>
-</div>
-<div class="sect3">
-<h4 id="_salva_resultados">Salva Resultados</h4>
-<div class="paragraph"><p>Finalmente, o resultado da operação precisa ser salvo na variável
-A.
-Para tal, o endereço de A (FF03) é copiado para o registrador de
-endereço (MAR) no instante t11.
-No instante t12 seguinte, o resultado da operação aritmética
-armazenado em ACC é copiado para o registrador de dados (MBR).
-Neste mesmo instante, a Unidade de Controle envia o sinal de escrita
-para a memória, que localiza o endereço FF03 e escreve nele o
-resultado da operação aritmética que foi salvo em ACC, ou seja,
-oito (8).</p></div>
-<div class="listingblock">
-<div class="content">
-<pre><tt>t11:    MAR &lt;- (FF03)
-t12:    MBR &lt;- ACC
-        Memória &lt;- write</tt></pre>
-</div></div>
-</div>
-<div class="sect3">
-<h4 id="_instrução_completa">Instrução completa</h4>
-<div class="paragraph"><p>Podemos agora visualizar a seguir como a primeira instrução do
-programa (A = B * C) foi executada em microoperações.</p></div>
-<div class="listingblock">
-<div class="content">
-<pre><tt>// Busca de Instrução
-t1:     MAR &lt;- PC
-        Memória &lt;- fetch;
-t2:     MBR &lt;- ‘A = B * C’
-        PC &lt;- PC + 1
-t3:     IR &lt;- MBR
-
-//Busca de Dados (B)
-t4:     MAR &lt;- (FF04)
-        Memória &lt;- read
-t5:     MBR &lt;- 2
-t6:     ACC &lt;- MBR
-
-//Busca de Dados (C)
-t7:     MAR &lt;- (FF05)
-        Memória &lt;- read
-t8:     MBR &lt;- 4
-t9:     R1 &lt;- MBR
-
-//Execução
-t10:    ACC &lt;- ACC * R1
-
-//Salva resultados
-t11:    MAR &lt;- (FF03)
-t12:    MBR &lt;- ACC
-        Memória &lt;- write</tt></pre>
-</div></div>
-<div class="paragraph"><p>A primeira instrução foi finalizada em 12 passos.
-Se cada passo for 1 ciclo de clock, então temos 12 ciclos do
-relógio para concluir essa instrução.
-A segunda instrução do programa (B = A + 2) é muito semelhante, e
-também precisará de 12 passos para ser executada.
-Esse é um ótimo exercício para você praticar.
-Ao final a memória estará diferente de como iniciou, e deverá
-estar com os conteúdos apresentados na <a href="#tabela_exemplo2">[tabela_exemplo2]</a>.</p></div>
-<div class="tableblock" id="tabela_exemplo2">
-<table rules="all"
-width="90%"
-frame="void"
-cellspacing="0" cellpadding="4">
-<caption class="title">Tabela 3. Memória após execução do programa.</caption>
-<col width="33%" />
-<col width="66%" />
-<thead>
-<tr>
-<th align="center" valign="top"> Endereço </th>
-<th align="center" valign="top"> Instrução ou Dado</th>
-</tr>
-</thead>
-<tbody>
-<tr>
-<td align="center" valign="top"><p class="table">FF01</p></td>
-<td align="center" valign="top"><p class="table">A = B * C</p></td>
-</tr>
-<tr>
-<td align="center" valign="top"><p class="table">FF02</p></td>
-<td align="center" valign="top"><p class="table">B = A + 2</p></td>
-</tr>
-<tr>
-<td align="center" valign="top"><p class="table">FF03</p></td>
-<td align="center" valign="top"><p class="table">8  // valor de A</p></td>
-</tr>
-<tr>
-<td align="center" valign="top"><p class="table">FF04</p></td>
-<td align="center" valign="top"><p class="table">10  // valor de B</p></td>
-</tr>
-<tr>
-<td align="center" valign="top"><p class="table">FF05</p></td>
-<td align="center" valign="top"><p class="table">4  // valor de C</p></td>
-</tr>
-</tbody>
-</table>
-</div>
-</div>
-</div>
-<div class="sect2">
-<h3 id="_recapitulando_3">Recapitulando</h3>
-<div class="paragraph"><p>Neste capítulo vimos que a Unidade de Controle é responsável por
-controlar como e quando as instruções dos programas são executadas.
-Elas fazem isso quebrando as intrusões em estágios e os estágios
-em Microoperações.
-Desta forma, as Microoperações tornam-se as menores unidades de
-execução do computador.
-Como são muito simples, as Microoperações são mais fáceis de
-serem implementadas pelo hardware e o projeto de uma CPU pode ser
-reutilizado em diversas ocasiões.</p></div>
-</div>
-</div>
-</div>
-<div class="sect1">
-<h2 id="_conjunto_de_instruções">Conjunto de Instruções</h2>
-<div class="sectionbody">
-<div class="quoteblock">
-<div class="title">Objetivos do capítulo</div>
-<div class="content">
-<div class="paragraph"><p>Ao final deste capítulo você deverá ser capaz de:</p></div>
-<div class="ulist"><ul>
-<li>
-<p>
-Listar as principais características de um conjunto de instrução
-</p>
-</li>
-<li>
-<p>
-Definir e elencar os prós e contras das arquiteturas RISC e CISC
-</p>
-</li>
-</ul></div>
-</div>
-<div class="attribution">
-</div></div>
-<div class="paragraph"><p>Neste capítulo vamos estudar o que é o Conjunto de Instruções e sua relevância no projeto de um processador.
-Sua características repercutem em todas principais características do processador, se tornando a principal e primeira decisão de projeto a ser tomada.</p></div>
-<div class="sect2">
-<h3 id="_introdução_3">Introdução</h3>
-<div class="paragraph"><p>O termo Conjunto de Instruções vem do inglês Instruction Set Architecture (ISA).
-ISA é a interface entre os softwares que serão executados pelo processador e o próprio processador.
-Ele define todas instruções de máquina serão interpretadas pela Unidade de Controle e executadas.
-Podemos então definir Conjunto de Instruções como sendo a coleção completa de todas instruções reconhecidas e executadas pela CPU.
-Essas instruções são também chamadas de Código de Máquina, e são o ponto inicial para o projeto de uma arquitetura e é essencial na definição de qualidade do sistema como um todo.</p></div>
-</div>
-<div class="sect2">
-<h3 id="_o_projeto_de_um_conjunto_de_instruções">O projeto de um Conjunto de Instruções</h3>
-<div class="sect3">
-<h4 id="_arquitetura">Arquitetura</h4>
-<div class="paragraph"><p>Um Conjunto de Instruções pode ser classificado como uma das quatro arquiteturas:</p></div>
-<div class="ulist"><ul>
-<li>
-<p>
-Arquitetura de Pilha
-</p>
-</li>
-<li>
-<p>
-Baseada em Acumulador
-</p>
-</li>
-<li>
-<p>
-Registrador-Registrador ou Load/Store
-</p>
-</li>
-<li>
-<p>
-Registrador-Memória
-</p>
-</li>
-</ul></div>
-<div class="paragraph"><p>A arquitetura de Pilha é a mais simples possível.
-Como pode ser observado na <a href="#fig_pilha">[fig_pilha]</a>, os dados necessários para a execução das operações pela ULA são provenientes de registradores especiais organizados na forma de uma pilha.
-Note que toda operação é realizada entre o registrador que indica o Topo de Pilha (apontado pelo registrador TOS) e o registrador seguinte.
-Esse conjunto de instruções é muito simples porque a Unidade de Controle nunca precisa decodificar a instrução para saber quais registradores serão utilizados nas operações lógicas e aritméticas.
-Sempre será o topo da pilha e o registrador seguinte.</p></div>
-<div class="imageblock" id="fig_pilha">
-<div class="content">
-<img src="images/cap4/fig_pilha.jpg" alt="scaledwidth=“50%"" />
-</div>
-<div class="title">Figura 15. ISA baseado em Pilha</div>
-</div>
-<div class="paragraph"><p>Já na arquitetura baseada em Acumulador (<a href="#fig_acumulador">[fig_acumulador]</a>) uma complexidade é adicionada.
-Um dos dados vem sempre do registrador Acumulador, mas o outro é mais livre.
-Na figura esse segundo dado vem da memória, mas poderia vir de um outro registrador designado na instrução.
-Neste caso, a instrução a ser decodificada pela Unidade de Controle precisará trazer de onde vem o segundo dado a ser utilizado, já que o primeiro é sempre proveniente do Acumulador.</p></div>
-<div class="imageblock" id="fig_acumulador">
-<div class="content">
-<img src="images/cap4/fig_acumulador.jpg" alt="scaledwidth=“50%"" />
-</div>
-<div class="title">Figura 16. ISA baseado em Acumulador</div>
-</div>
-<div class="paragraph"><p>Na sequência, a terceira arquitetura mais complexa é chamada Arquitetura Load/Store ou Registrador-Registrador (<a href="#fig_regreg">[fig_regreg]</a>).
-Nesta arquitetura, todas operações lógicas e aritméticas executadas pela ULA são provenientes de dois registradores a serem determinados pela instrução.
-A única forma de acessar dados da memória é através de instruções especiais para escrever na memória (store) ou para trazer um dado da memória para um registrador (load).
-Assim, toda instrução a ser decodificada pela CPU deverá indicar o endereço de dois registradores que serão utilizados na operação lógica ou aritmética, ou um endereço de memória se a instrução for um load ou um store.</p></div>
-<div class="imageblock" id="fig_regreg">
-<div class="content">
-<img src="images/cap4/fig_regreg.jpg" alt="scaledwidth=“50%"" />
-</div>
-<div class="title">Figura 17. ISA Registrador-Registrador</div>
-</div>
-<div class="paragraph"><p>Por último, a mais complexa arquitetura é a Registrador-Memória (<a href="#fig_regmem">[fig_regmem]</a>).
-Esta arquitetura permite que a ULA execute operações lógicas e aritméticas envolvendo ao mesmo tempo um registrador indicado pela instrução e um conteúdo proveniente da memória.
-Esse tipo de instrução deve então trazer em seu conteúdo o código do registrador a ser utilizado e o endereço de memória do segundo dado.</p></div>
-<div class="imageblock" id="fig_regmem">
-<div class="content">
-<img src="images/cap4/fig_regmem.jpg" alt="scaledwidth=“50%"" />
-</div>
-<div class="title">Figura 18. ISA Registrador-Memória</div>
-</div>
-<div class="paragraph"><p>É muito importante aqui observar que arquiteturas mais simples, como a de Pilha por exemplo, fazem com as instruções a serem decodificadas pela Unidade de Controle sejam muito simples.
-Com instruções simples, a própria Unidade de Controle será simples, pequena e barata de produzir.
-Por outro lado, instruções simples resultam em operações limitadas.
-Assim, uma tarefa básica, como somar dois números, em uma Arquitetura de Pilha vai necessitar que pelo menos 4 operações sejam realizadas: colocar na pilha o primeiro dado, colocar na pilha o segundo dado, somar os dois elementos da pilha, salvar o resultado na pilha.
-Essa mesma operação numa arquitetura Registrador-Memória seria executada numa instrução única, indicando o registrador utilizado para ser o primeiro dado, o endereço de memória do segundo dado e o registrador que vai guardar o resultado.</p></div>
-<div class="paragraph"><p>A escolha da arquitetura é uma questão importantíssima de projeto e geralmente baseia-se na relação entre o desempenho que se quer atingir e o preço do processador ao final.</p></div>
-<div class="paragraph"><p>Após definida a arquitetura do Conjunto de Instruções, o projetista deve cuidar do projeto das instruções propriamente ditas.
-Neste projeto cinco pontos devem ser projetados:</p></div>
-<div class="ulist"><ul>
-<li>
-<p>
-Modelo de Memória
-</p>
-</li>
-<li>
-<p>
-Tipos de Dados
-</p>
-</li>
-<li>
-<p>
-Formato das Instruções
-</p>
-</li>
-<li>
-<p>
-Tipo de Instruções
-</p>
-</li>
-<li>
-<p>
-Modo de Endereçamento
-</p>
-</li>
-</ul></div>
-</div>
-<div class="sect3">
-<h4 id="_modelo_de_memória">Modelo de Memória</h4>
-<div class="paragraph"><p>O modelo de memória define para cada instrução de onde vem e para onde vão os dados.
-Os dados podem vir da memória principal, ou memória Cache, de um registrador, ou de um dispositivo de Entrada e Saída.
-Além disso, o projeto do ISA deve definir alguns pontos cruciais.</p></div>
-<div class="sect4">
-<h5 id="_memória_alinhada_x_não_alinhada">Memória alinhada x não alinhada</h5>
-<div class="paragraph"><p>As memórias geralmente são organizadas em bytes.
-Isso significa que o byte é a menor unidade de acesso à memória, e assim, cada endereço de memória acessa um byte.
-A <a href="#tabela_memoria">[tabela_memoria]</a> apresenta um exemplo de organização de memória por bytes.
-Neste caso, o endereço 0 diz respeito ao Byte 0 da primeira linha.
-Já o endereço 1 ao Byte 1, o endereço 2 ao Byte 2 e o endereço 3 ao Byte 3.
-Enquanto que os endereços de 4 a 7 já dizem respeitos aos bytes da segunda linha.</p></div>
-<div class="tableblock" id="tabela_memoria">
-<table rules="all"
-width="90%"
-frame="void"
-cellspacing="0" cellpadding="4">
-<caption class="title">Tabela 4. Exemplo de uma memória organizada por bytes</caption>
-<col width="20%" />
-<col width="20%" />
-<col width="20%" />
-<col width="20%" />
-<col width="20%" />
-<thead>
-<tr>
-<th align="center" valign="top"> Endereço </th>
-<th align="center" valign="top"> Byte 0  </th>
-<th align="center" valign="top"> Byte 1  </th>
-<th align="center" valign="top"> Byte 2  </th>
-<th align="center" valign="top"> Byte 3</th>
-</tr>
-</thead>
-<tbody>
-<tr>
-<td align="center" valign="top"><p class="table">0</p></td>
-<td align="center" valign="top"><p class="table"></p></td>
-<td align="center" valign="top"><p class="table"></p></td>
-<td align="center" valign="top"><p class="table"></p></td>
-<td align="center" valign="top"><p class="table"></p></td>
-</tr>
-<tr>
-<td align="center" valign="top"><p class="table">4</p></td>
-<td align="center" valign="top"><p class="table">13</p></td>
-<td align="center" valign="top"><p class="table">23</p></td>
-<td align="center" valign="top"><p class="table"></p></td>
-<td align="center" valign="top"><p class="table"></p></td>
-</tr>
-<tr>
-<td align="center" valign="top"><p class="table">8</p></td>
-<td align="center" valign="top"><p class="table"></p></td>
-<td align="center" valign="top"><p class="table"></p></td>
-<td align="center" valign="top"><p class="table"></p></td>
-<td align="center" valign="top"><p class="table"></p></td>
-</tr>
-<tr>
-<td align="center" valign="top"><p class="table">12</p></td>
-<td align="center" valign="top"><p class="table"></p></td>
-<td align="center" valign="top"><p class="table"></p></td>
-<td align="center" valign="top"><p class="table"></p></td>
-<td align="center" valign="top"><p class="table"></p></td>
-</tr>
-<tr>
-<td align="center" valign="top"><p class="table">16</p></td>
-<td align="center" valign="top"><p class="table"></p></td>
-<td align="center" valign="top"><p class="table"></p></td>
-<td align="center" valign="top"><p class="table"></p></td>
-<td align="center" valign="top"><p class="table"></p></td>
-</tr>
-<tr>
-<td align="center" valign="top"><p class="table">. . .</p></td>
-<td align="center" valign="top"><p class="table"></p></td>
-<td align="center" valign="top"><p class="table"></p></td>
-<td align="center" valign="top"><p class="table"></p></td>
-<td align="center" valign="top"><p class="table"></p></td>
-</tr>
-</tbody>
-</table>
-</div>
-<div class="paragraph"><p>A memória é organizada desta forma, mas há diferentes tipos de dados.
-Uma variável inteira, por exemplo, pode ser declarada como um byte, ou um inteiro curto de 2 bytes, um inteiro de 4 bytes, ou até mesmo um inteiro longo de 8 bytes.
-Se o conjunto de instruções fixar que a memória será apenas acessada de forma alinhada, significa que um dado não pode ultrapassar uma linha.
-Assim, os dados de 4 bytes deverão obrigatoriamente ser armazenados nos endereços 0, 4, 8, 12, 16 etc.</p></div>
-<div class="paragraph"><p>Esta decisão visa facilitar e acelerar o trabalho do processador ao acessar a memória.
-Cada vez que a memória precisar ser acessada para buscar um número de 4 bytes, o processador deve apenas verificar se o endereço é um múltiplo de 4.
-Se ele não for, o acesso é negado e o programa é encerrado.
-A desvantagem desta abordagem é que muitas áreas podem ficar desperdiçadas.
-Por exemplo, se um dado de 2 bytes é armazenado no endereço 4 (como mostra a <a href="#tabela_memoria">[tabela_memoria]</a>), os Bytes 0 e 1 são utilizados, mas os Bytes 2 e ficam disponíveis.
-Mesmo assim, se um dado de 4 bytes precisar ser armazenado, ele não poderá ser feito em uma posição livre múltipla de 4 (0, 8, 12, 6 etc.), como por exemplo, salvando os dois primeiros bytes nos endereços 6 e 7 (segunda linha) e os outros 2 bytes nos endereços 8 e 9 (terceira linha).</p></div>
-<div class="paragraph"><p>Já se o conjunto de instruções permitir o acesso não alinhado à memória, todas essas restrições se acabam e os dados podem ser acessados em quaisquer posições.
-O uso da memória termina tendo um maior aproveitamento, já que menos áreas livres existirão.
-O problema agora é com o desempenho.
-Todo processador acessa a memória através de um barramento.
-Para otimizar o acesso, os barramentos geralmente são largos o suficiente para trazer uma linha inteira de memória, ou mais.
-Com a memória alinhada fica mais fácil, porque para buscar um dado a CPU só precisa saber em que linha ele está, daí é só trazê-la para a CPU.</p></div>
-<div class="paragraph"><p>Já na memória não alinhada, quando um dado é buscado a CPU precisa saber em que linha ele está, em que posição exatamente começa, se ele invade a próxima linha, e onde termina.
-Esta operação é mais uma responsabilidade para a CPU e torna o processo de leitura mais lento.</p></div>
-<div class="paragraph"><p>Processadores da arquitetura Intel, por exemplo, utilizam memórias alinhadas, porque percebeu-se que o ganho com o desperdício de memória não compensa o tempo gasto buscando dados em linhas diferentes.</p></div>
-</div>
-<div class="sect4">
-<h5 id="_memória_para_dados_e_instruções">Memória para dados e instruções</h5>
-<div class="paragraph"><p>Outra decisão importante com relação ao acesso à memória é se a faixa de endereços da memória de dados será a mesmo da memória de instruções.
-Desde a criação das Arquiteturas Harvard (em substituição às de Von Neumann) que os dados são armazenados em áreas de memória separadas das instruções.
-Isso ajuda principalmente no Pipeline, porque a CPU pode no mesmo ciclo buscar uma instrução e buscar os dados de uma outra instrução.</p></div>
-<div class="paragraph"><p>Na definição do Conjunto de Instruções o projetista deve decidir como serão os endereços de dessas áreas de memória.
-Por exemplo, se uma memória tiver 2 milhões de bytes (2MB), como cada byte possui um endereço, ela terá endereços de 0 a 1.999.999.
-Digamos que a primeira parte de memória seja para os dados e a segunda para as instruções.
-Neste caso, haverá duas opções.
-A memória pode ser organizada como uma faixa única de endereços, então os endereços de 0 a 999.999 serão utilizados para armazenar os dados, e os endereços de 1.000.000 a 1.999.999 armazenarão as instruções.</p></div>
-<div class="paragraph"><p>O problema desta abordagem, seguindo o mesmo exemplo, é que neste sistema só poderá haver 1 milhão de dados 1 milhão de instruções.
-Não será possível o armazenamento de nenhuma instrução a mais do que isso, mesmo que a área de dados esteja com posições disponíveis.</p></div>
-<div class="paragraph"><p>Como solução, o Conjunto de Instruções pode definir instruções especiais para buscar dados e instruções para buscar instruções.
-Quando uma instrução de busca for decodificada a Unidade de Controle saberá que se trata de um dado ou um endereço e vai buscar a informação exatamente na memória especificada.
-No exemplo dado, as instruções ficariam armazenadas na memória de instrução nos endereços de entre 0 e 1.999.999, e os dados na memória de dados também no endereço de 0 e 1.999.999.
-Mas observe que a memória do exemplo só possui 2 milhões de bytes (2MB), mesmo assim, neste exemplo, o sistema seria capaz de endereçar 4 milhões de bytes (4MB).
-Isso a tornaria pronta para um aumento futuro do espaço de memória.</p></div>
-</div>
-<div class="sect4">
-<h5 id="_ordem_dos_bytes">Ordem dos bytes</h5>
-<div class="paragraph"><p>No início do desenvolvimento dos computadores, os engenheiros projetistas tiveram que tomar uma decisão simples, mas muito importante.
-Quando temos dados que ocupam mais de um byte devemos começar salvando os bytes mais significativos, ou os menos significativos?
-Esta decisão não afeta em nada o desempenho ou o custo dos sistemas.
-É simplesmente uma decisão que precisa ser tomada.</p></div>
-<div class="paragraph"><p>Aqueles projetos que adotaram a abordagem de salvar os dados a partir dos bytes mais significativos foram chamados de Big Endian, enquanto que aqueles que adotaram iniciar pelo byte menos significativo foram chamados de Little Endian.</p></div>
-<div class="paragraph"><p>Imagine que uma instrução pede para que a palavra UFPB seja salva no endereço 8 da memória.
-Uma palavra pode ser vista como um vetor de caracteres, onde cada caracter ocupa 1 byte.
-Na <a href="#tabela_big">[tabela_big]</a> é apresentada a abordagem Big Endian.
-Neste caso, o byte mais significativo (o mais a esquerda) é o que representa a letra U.
-Desta forma, ele é armazenado no Byte mais a esquerda, seguido pela letra F, a letra P e a letra B.</p></div>
-<div class="tableblock" id="tabela_big">
-<table rules="all"
-width="90%"
-frame="void"
-cellspacing="0" cellpadding="4">
-<caption class="title">Tabela 5. Exemplo de uma memória Big Endian</caption>
-<col width="20%" />
-<col width="20%" />
-<col width="20%" />
-<col width="20%" />
-<col width="20%" />
-<thead>
-<tr>
-<th align="center" valign="top"> Endereço </th>
-<th align="center" valign="top"> Byte 0  </th>
-<th align="center" valign="top"> Byte 1  </th>
-<th align="center" valign="top"> Byte 2  </th>
-<th align="center" valign="top"> Byte 3</th>
-</tr>
-</thead>
-<tbody>
-<tr>
-<td align="center" valign="top"><p class="table">0</p></td>
-<td align="center" valign="top"><p class="table"></p></td>
-<td align="center" valign="top"><p class="table"></p></td>
-<td align="center" valign="top"><p class="table"></p></td>
-<td align="center" valign="top"><p class="table"></p></td>
-</tr>
-<tr>
-<td align="center" valign="top"><p class="table">4</p></td>
-<td align="center" valign="top"><p class="table"></p></td>
-<td align="center" valign="top"><p class="table"></p></td>
-<td align="center" valign="top"><p class="table"></p></td>
-<td align="center" valign="top"><p class="table"></p></td>
-</tr>
-<tr>
-<td align="center" valign="top"><p class="table">8</p></td>
-<td align="center" valign="top"><p class="table">U</p></td>
-<td align="center" valign="top"><p class="table">F</p></td>
-<td align="center" valign="top"><p class="table">P</p></td>
-<td align="center" valign="top"><p class="table">B</p></td>
-</tr>
-<tr>
-<td align="center" valign="top"><p class="table">12</p></td>
-<td align="center" valign="top"><p class="table"></p></td>
-<td align="center" valign="top"><p class="table"></p></td>
-<td align="center" valign="top"><p class="table"></p></td>
-<td align="center" valign="top"><p class="table"></p></td>
-</tr>
-<tr>
-<td align="center" valign="top"><p class="table">16</p></td>
-<td align="center" valign="top"><p class="table"></p></td>
-<td align="center" valign="top"><p class="table"></p></td>
-<td align="center" valign="top"><p class="table"></p></td>
-<td align="center" valign="top"><p class="table"></p></td>
-</tr>
-<tr>
-<td align="center" valign="top"><p class="table">. . .</p></td>
-<td align="center" valign="top"><p class="table"></p></td>
-<td align="center" valign="top"><p class="table"></p></td>
-<td align="center" valign="top"><p class="table"></p></td>
-<td align="center" valign="top"><p class="table"></p></td>
-</tr>
-</tbody>
-</table>
-</div>
-<div class="paragraph"><p>Já na abordagem Little Endian mostrada na <a href="#tabela_little">[tabela_little]</a> a mesma palavra é armazenada iniciando pelo byte menos significativo, da direita para a esquerda.
-Apesar de parecer estranho, note que o que muda é a localização dos Bytes 0, 1, 2 e 3.
-Comparando as abordagens Big Endian e Little Endian no exemplo, em ambos a letra U é armazenada no Byte 0, a F no Byte 1, a P no Byte 2 e a B no Byte 3.
-A diferença é que no Little Endian os bytes são contados da direita para a esquerda.</p></div>
-<div class="tableblock" id="tabela_little">
-<table rules="all"
-width="90%"
-frame="void"
-cellspacing="0" cellpadding="4">
-<caption class="title">Tabela 6. Exemplo de uma memória Little Endian</caption>
-<col width="20%" />
-<col width="20%" />
-<col width="20%" />
-<col width="20%" />
-<col width="20%" />
-<thead>
-<tr>
-<th align="center" valign="top"> Endereço </th>
-<th align="center" valign="top"> Byte 3  </th>
-<th align="center" valign="top"> Byte 2  </th>
-<th align="center" valign="top"> Byte 1  </th>
-<th align="center" valign="top"> Byte 0</th>
-</tr>
-</thead>
-<tbody>
-<tr>
-<td align="center" valign="top"><p class="table">0</p></td>
-<td align="center" valign="top"><p class="table"></p></td>
-<td align="center" valign="top"><p class="table"></p></td>
-<td align="center" valign="top"><p class="table"></p></td>
-<td align="center" valign="top"><p class="table"></p></td>
-</tr>
-<tr>
-<td align="center" valign="top"><p class="table">4</p></td>
-<td align="center" valign="top"><p class="table"></p></td>
-<td align="center" valign="top"><p class="table"></p></td>
-<td align="center" valign="top"><p class="table"></p></td>
-<td align="center" valign="top"><p class="table"></p></td>
-</tr>
-<tr>
-<td align="center" valign="top"><p class="table">8</p></td>
-<td align="center" valign="top"><p class="table">B</p></td>
-<td align="center" valign="top"><p class="table">P</p></td>
-<td align="center" valign="top"><p class="table">F</p></td>
-<td align="center" valign="top"><p class="table">U</p></td>
-</tr>
-<tr>
-<td align="center" valign="top"><p class="table">12</p></td>
-<td align="center" valign="top"><p class="table"></p></td>
-<td align="center" valign="top"><p class="table"></p></td>
-<td align="center" valign="top"><p class="table"></p></td>
-<td align="center" valign="top"><p class="table"></p></td>
-</tr>
-<tr>
-<td align="center" valign="top"><p class="table">16</p></td>
-<td align="center" valign="top"><p class="table"></p></td>
-<td align="center" valign="top"><p class="table"></p></td>
-<td align="center" valign="top"><p class="table"></p></td>
-<td align="center" valign="top"><p class="table"></p></td>
-</tr>
-<tr>
-<td align="center" valign="top"><p class="table">. . .</p></td>
-<td align="center" valign="top"><p class="table"></p></td>
-<td align="center" valign="top"><p class="table"></p></td>
-<td align="center" valign="top"><p class="table"></p></td>
-<td align="center" valign="top"><p class="table"></p></td>
-</tr>
-</tbody>
-</table>
-</div>
-<div class="paragraph"><p>[IMPORTANT] O importante é observar que se um computador Little Endian precisar trocar dados com um computador Big Endian, eles precisarão antes ser convertidos para evitar problemas.
-A palavra UFPB salva num computador Big Endian, por exemplo, se for transmitida para um Little Endian, deve antes ser convertida para BPFU para evitar incompatibilidade.</p></div>
-<div class="paragraph"><p>[NOTE] Computadores Intel, AMD e outras arquiteturas mais populares utilizam o modelo Little Endian, enquanto que a arquitetura da Internet (TCP/IP) e máquinas IBM adotam o Big Endian.</p></div>
-</div>
-<div class="sect4">
-<h5 id="_acesso_aos_registradores">Acesso aos registradores</h5>
-<div class="paragraph"><p>A forma de acesso aos registradores também é essencial para a definição das instruções de máquina.
-Cada endereço é referenciado através de um código, como se fosse um endereço, assim como nas memórias.
-O Conjunto de Instruções deve definir quantos endereços de registradores serão possíveis e o tamanho deles, e as políticas de acesso.
-Essas decisões são de extrema importância para o projeto do Conjunto de Instruções e do processador como um todo.</p></div>
-</div>
-</div>
-<div class="sect3">
-<h4 id="_tipos_de_dados">Tipos de Dados</h4>
-<div class="paragraph"><p>Quando escrevemos programas em linguagens de programação somos habituados a utilizar diversos tipos de dados, como inteiros, caracteres, pontos flutuantes e endereços.
-O que muitos esquecem, ou não sabem, é esses tipos são definidos pelo processador, no momento do projeto do Conjunto de Instruções.
-Os tipos mais comuns de dados são:</p></div>
-<div class="ulist"><ul>
-<li>
-<p>
-Inteiros
-</p>
-</li>
-<li>
-<p>
-Decimais
-</p>
-</li>
-<li>
-<p>
-Pontos flutuantes
-</p>
-</li>
-<li>
-<p>
-Caracteres
-</p>
-</li>
-<li>
-<p>
-Dados lógicos
-</p>
-</li>
-</ul></div>
-<div class="paragraph"><p>Cada um destes dados pode ainda possuir diversas variantes, como por exemplo:</p></div>
-<div class="ulist"><ul>
-<li>
-<p>
-Inteiros e Pontos flutuantes: com e sem sinal, curto, médio ou grande
-</p>
-</li>
-<li>
-<p>
-Caracteres: ASCII, Unicode ou outras
-</p>
-</li>
-<li>
-<p>
-Dados lógicos: booleanos ou mapas de bits
-</p>
-</li>
-</ul></div>
-<div class="paragraph"><p>O Conjunto de Instruções de máquina pode adotar todos os tipos e variedades, ou um subconjunto delas.
-Se um processador não utilizar um tipo de dado, o compilador deverá oferecer uma alternativa ao programador e, no momento de compilação, fazer a relação entre o tipo utilizado na linguagem de programação e o tipo existente na linguagem de máquina.</p></div>
-<div class="paragraph"><p>Sempre que for determinado que um tipo de dado será utilizado pelo processador, é também necessário que se criem instruções para manipular esses dados.
-Por exemplo, se for definido que a arquitetura vai suportar números de ponto flutuante de 32 bits, será necessário também criar instruções para executar operações aritméticas com esses números, criar registradores para armazena-los e barramentos para transporta-los.
-É uma decisão que impacto em todo o projeto do processador.</p></div>
-</div>
-<div class="sect3">
-<h4 id="_formato_das_instruções">Formato das Instruções</h4>
-<div class="paragraph"><p>Em seguida, é preciso também definir quais serão os formatos de instrução aceitos pela Unidade de Controle.
-No geral, toda instrução de máquina deve ter pelo menos o código da operação (ou Opcode) e os endereços para os parâmetros necessários, que podem ser registradores, posições de memória ou endereços de dispositivos de Entrada e Saída.</p></div>
-<div class="paragraph"><p>Nesta definição de formatos é necessário que se defina quantos endereços cada instrução poderá trazer.
-Para ilustrar, suponha que na linguagem de alto nível a operação A = B + C seja escrita e precise ser compilada.
-Se o Conjunto de Instruções adotar instruções com 3 endereços, fica simples.
-O código da operação de soma é ADD e com 3 endereços ela ficaria algo semelhante a:</p></div>
-<div class="listingblock">
-<div class="content">
-<pre><tt>ADD A, B, C</tt></pre>
-</div></div>
-<div class="paragraph"><p>Onde A, B e C são endereços que podem ser de memória, registrador ou dispositivo de Entrada e Saída.
-Isso não vem ao caso neste momento.</p></div>
-<div class="paragraph"><p>Mas se o Conjunto de Instruções suportar apenas 2 endereços, ele pode adotar que o resultado sempre será salvo no endereço do primeiro parâmetro, sendo assim, a instrução teria que ser compilada da seguinte forma:</p></div>
-<div class="listingblock">
-<div class="content">
-<pre><tt>MOV B, R
-ADD R, C
-MOV R, A</tt></pre>
-</div></div>
-<div class="paragraph"><p>A instrução MOV teve que ser adicionada para copiar o conteúdo de B para R (um registrador qualquer).
-Em seguida a instrução ADD R, C é executa, que soma o conteúdo de R com C e salva o resultado em R.
-No final, a instrução MOV é chamada novamente para salvar o resultado de R em A e finalizar a instrução.
-Note que todas instruções neste exemplo utilizaram no máximo 2 endereços.</p></div>
-<div class="paragraph"><p>Já se a arquitetura utilizar instruções de apenas 1 endereço, será necessário utilizar uma arquitetura baseada em Acumulador e toda operação será entre o Acumulador e um endereço, e o resultado será também salvo no acumulador.
-Assim, a instrução seria compilada como:</p></div>
-<div class="listingblock">
-<div class="content">
-<pre><tt>ZER ACC
-ADD B
-ADD C
-STO A</tt></pre>
-</div></div>
-<div class="paragraph"><p>Aqui, quatro instruções foram necessárias.
-A primeira zeta o conteúdo do Acumulador (ACC).
-A segunda soma o Acumulador com o conteúdo apontado pelo endereço B e salva o resultado no Acumulador.
-A terceira soma o conteúdo do Acumulador com C e salva no Acumulador e, por fim, a última instrução transfere o resultado do Acumulador para o endereço de A.
-Note aqui também que todas instruções não passaram de um endereço para os parâmetros.</p></div>
-<div class="paragraph"><p>A última opção seria não utilizar endereços em suas instruções principais.
-Isso é possível se for utilizada uma Arquitetura Baseada em Pilha.
-Neste caso, duas instruções são adicionadas: POP e PUSH.
-A instrução PUSH adiciona um valor ao topo da pilha, enquanto que POP remove um elemento do topo da pilha e adiciona seu conteúdo em um endereço.
-Dessa forma, a instrução seria compilada assim:</p></div>
-<div class="listingblock">
-<div class="content">
-<pre><tt>POP B
-POP C
-ADD
-PUSH A</tt></pre>
-</div></div>
-<div class="paragraph"><p>Neste caso a primeira instrução colocou o conteúdo do endereço de B na pilha, a segunda instrução fez o mesmo com C.
-A terceira instrução é a única que não precisa de endereço.
-Ela faz a soma com os dois últimos valores adicionados à pilha (B e C, no caso) e salva o resultado de volta na pilha.
-A instrução PUSH vai remover o último valor da pilha (resultado da soma) e salvar na variável endereçada por A.</p></div>
-<div class="paragraph"><p>É possível perceber que quanto menos endereços, mais simples são as instruções.
-Isso é bom porque a Unidade de Controle não precisará de muito processamento para executa-las.
-Por outro lado, o programa compilado se torna maior e termina consumindo mais ciclos.
-A decisão se as instruções serão mais simples ou mais complexas é muito importantes e vamos tratar dela mais a frente neste capítulo.</p></div>
-<div class="paragraph"><p>Geralmente as arquiteturas adotam abordagem mistas.
-Por exemplo, aquelas que suportam instruções com 2 endereços geralmente também suportam instruções com 1 endereço e com nenhum.
-Isso é também bem interessante, porque torna o processador bastante versátil.
-Por outro lado, é mais complexidade à Unidade de Controle.
-Cada instrução que for ser executada precisa antes ser classificada e depois despachada para uma unidade de execução específica.</p></div>
-</div>
-<div class="sect3">
-<h4 id="_tipos_de_instruções">Tipos de Instruções</h4>
-<div class="paragraph"><p>Além de definir como serão as instruções, é necessário também definir que tipos de instruções serão executadas pelo processador.</p></div>
-<div class="paragraph"><p>Os principais tipos de instrução são:</p></div>
-<div class="ulist"><ul>
-<li>
-<p>
-Movimentação de dados: como os dados serão transferidos interna e externamente ao processador
-</p>
-</li>
-<li>
-<p>
-Aritméticas: que operações serão realizadas, como exponenciais, trigonométricas, cálculos com pontos flutuantes, com e sem sinais, com números curtos e longos etc.
-</p>
-</li>
-<li>
-<p>
-Lógicas: AND, OR, NOT e XOR
-</p>
-</li>
-<li>
-<p>
-Conversão: de caracteres para números, de inteiros para reais, decimal para binário etc.
-</p>
-</li>
-<li>
-<p>
-Entrada e Saída: haverá instruções específicas ou haverá um controlador específico, como um DMA (Direct Memory Access)
-</p>
-</li>
-<li>
-<p>
-Controle: instruções para controlar os dispositivos diversos do computador
-</p>
-</li>
-<li>
-<p>
-Transferência de Controle: como a execução deixará um programa para passar para outro, para interromper um programa, chamar subprogramas, instruções de desvio e de interrupção.
-</p>
-</li>
-</ul></div>
-</div>
-<div class="sect3">
-<h4 id="_modos_de_endereçamento">Modos de Endereçamento</h4>
-<div class="paragraph"><p>Por último, no projeto de um Conjunto de Instruções é necessário determinar de que forma os endereços das instruções serão acessados.
-Ou seja, o que cada endereço de parâmetros de uma instrução podem representar.</p></div>
-<div class="paragraph"><p>Os principais modos de endereçamento são:</p></div>
-<div class="ulist"><ul>
-<li>
-<p>
-Imediato
-</p>
-</li>
-<li>
-<p>
-Direto
-</p>
-</li>
-<li>
-<p>
-Direto por Registrador
-</p>
-</li>
-<li>
-<p>
-Indireto
-</p>
-</li>
-<li>
-<p>
-Indireto por Registrador
-</p>
-</li>
-<li>
-<p>
-Indexado
-</p>
-</li>
-<li>
-<p>
-Indexado por Registrador
-</p>
-</li>
-</ul></div>
-<div class="paragraph"><p>O endereçamento Imediato é o mais simples possível e indica que o endereço na verdade é uma constante e pode ser utilizada imediatamente.</p></div>
-<div class="paragraph"><p>Por exemplo, na instrução a seguir:</p></div>
-<div class="listingblock">
-<div class="content">
-<pre><tt>ADD A, 5, 7</tt></pre>
-</div></div>
-<div class="paragraph"><p>Significa que a variável A deve receber o conteúdo da soma de 5 com 7.
-O endereços 5 e 7 são considerados Imediatos, já que não representam um endereço, e sim uma constante.</p></div>
-<div class="paragraph"><p>No endereçamento Direto o endereço representa um endereço de memória, como mostrado na instrução a seguir.</p></div>
-<div class="listingblock">
-<div class="content">
-<pre><tt>ADD A, B, 7</tt></pre>
-</div></div>
-<div class="paragraph"><p>Neste exemplo, o valor 7 continua sendo endereçamento de forma imediata, mas os endereços de A e B são endereços de memória e por isso, são chamados de Endereços Diretos.</p></div>
-<div class="paragraph"><p>No endereçamento Direto por Registrador os endereços representam registradores, e poderíamos ver o exemplo citado da seguinte forma:</p></div>
-<div class="listingblock">
-<div class="content">
-<pre><tt>ADD R1, R2, C</tt></pre>
-</div></div>
-<div class="paragraph"><p>Neste exemplo R1 e R2 são códigos para registradores e o endereçamento é chamado Direto por Registrador, enquanto que C é acessado através de Endereçamento Direto.</p></div>
-<div class="paragraph"><p>Já o endereçamento Indireto é aplicado quando é necessário que um acesso Direto seja feito antes para buscar o endereço alvo e só então o acesso é feito.
-O exemplo a seguir mostra um caso onde este endereçamento é utilizado.</p></div>
-<div class="listingblock">
-<div class="content">
-<pre><tt>ADD A, (B), 7</tt></pre>
-</div></div>
-<div class="paragraph"><p>Neste exemplo o endereço B entre parêntesis representa o acesso indireto.
-Isso indica que primeiramente o endereço de B deve ser acessado, mas lá não está o conteúdo a ser somado com 7, mas o endereço de memória onde o valor deverá ser encontrado.
-Este tipo de endereçamento é muito utilizado nas linguagens de programação para representar variáveis dinâmicas através de apontadores (ou ponteiros).</p></div>
-<div class="paragraph"><p>O endereçamento Indireto também pode ser feito por Registrador.
-No exemplo a seguir o valor sete não é somado ao conteúdo de R1, mas ao dado que está na memória no endereço apontado por R1.</p></div>
-<div class="listingblock">
-<div class="content">
-<pre><tt>ADD A, (R1), 7</tt></pre>
-</div></div>
-<div class="paragraph"><p>Outro endereçamento possível é o Indexado.
-Neste modo de endereçamento é necessário indicar o endereço do dado e um valor chamado Deslocamento.
-No exemplo a seguir, o endereçamento Indexado é aplicado para B[5].</p></div>
-<div class="listingblock">
-<div class="content">
-<pre><tt>ADD A, B[5], 7</tt></pre>
-</div></div>
-<div class="paragraph"><p>Isso indica que o dado a ser utilizado está no endereço B de memória adicionado de 5 posições.
-Ou seja, se a variável B estiver no endereço 1002 de memória, o valor B[5] estará no endereço 1007.
-O endereço de B é chamado de Endereço Base e o valor 5 é chamado de Deslocamento.
-Para realizar um endereçamento Indexado é necessário um somados que não seja a ULA para agilizar o processamento e realizar cada deslocamento.
-Este tipo de endereçamento é utilizado quando são utilizadas instruções de acesso a vetores.</p></div>
-<div class="paragraph"><p>Há também a possibilidade de realizar o endereçamento Indexado por Registrador, que utiliza um registrador ao invés da memória para armazenar o Endereço Base, como exibido a seguir:</p></div>
-<div class="listingblock">
-<div class="content">
-<pre><tt>ADD A, R1[5], 7</tt></pre>
-</div></div>
-</div>
-</div>
-<div class="sect2">
-<h3 id="_risc_x_cisc">RISC x CISC</h3>
-<div class="paragraph"><p>O projeto do Conjunto de Instruções inicia com a escolha de uma entre duas abordagens, a abordagem RISC e a CISC.
-O termo RISC é a abreviação de <strong>Reduced Instruction Set Computer</strong>, ou Computador de Conjunto de Instruções Reduzido e CISC vem de <strong>Complex Instruction Set Computer</strong>, ou Computador de Conjunto de Instruções Complexo.
-Um computador RISC parte do pressuposto de que um conjunto simples de instruções vai resultar numa Unidade de Controle simples, barata e rápida.
-Já os computadores CISC visam criar arquiteturas complexas o bastante a ponto de facilitar a vida dos compiladores, assim, programas complexos são compilados em programas de máquina mais curtos.
-Com programas mais curtos, os computadores CISC precisariam acessar menos a memória para buscar instruções e seriam mais rápidos.</p></div>
-<div class="paragraph"><p>A <a href="#tabela_risc_cisc">[tabela_risc_cisc]</a> resume as principais características dos computadores RISC em comparação com os CISC.
-Os processadores RISC geralmente adotam arquiteturas mais simples e que acessam menos a memória, em favor do acesso aos registradores.
-A arquitetura Registrador-Registrador é mais adotada, enquanto que os computadores CISC utilizam arquiteturas Registrador-Memória.</p></div>
-<div class="tableblock" id="tabela_risc_cisc">
-<table rules="all"
-width="90%"
-frame="void"
-cellspacing="0" cellpadding="4">
-<caption class="title">Tabela 7. Arquiteturas RISC x CISC</caption>
-<col width="33%" />
-<col width="33%" />
-<col width="33%" />
-<thead>
-<tr>
-<th align="center" valign="top"> Características           </th>
-<th align="center" valign="top"> RISC                           </th>
-<th align="center" valign="top"> CISC</th>
-</tr>
-</thead>
-<tbody>
-<tr>
-<td align="center" valign="top"><p class="table">Arquitetura</p></td>
-<td align="center" valign="top"><p class="table">Registrador-Registrador</p></td>
-<td align="center" valign="top"><p class="table">Registrador-Memória</p></td>
-</tr>
-<tr>
-<td align="center" valign="top"><p class="table">Tipos de Dados</p></td>
-<td align="center" valign="top"><p class="table">Pouca variedade</p></td>
-<td align="center" valign="top"><p class="table">Muito variada</p></td>
-</tr>
-<tr>
-<td align="center" valign="top"><p class="table">Formato das Instruções</p></td>
-<td align="center" valign="top"><p class="table">Instruções poucos endereços</p></td>
-<td align="center" valign="top"><p class="table">Instruções com muitos endereços</p></td>
-</tr>
-<tr>
-<td align="center" valign="top"><p class="table">Modo de Endereçamento</p></td>
-<td align="center" valign="top"><p class="table">Pouca variedade</p></td>
-<td align="center" valign="top"><p class="table">Muita variedade</p></td>
-</tr>
-<tr>
-<td align="center" valign="top"><p class="table">Estágios de Pipeline</p></td>
-<td align="center" valign="top"><p class="table">Entre 4 e 10</p></td>
-<td align="center" valign="top"><p class="table">Entre 20 e 30</p></td>
-</tr>
-<tr>
-<td align="center" valign="top"><p class="table">Acesso aos dados</p></td>
-<td align="center" valign="top"><p class="table">Via registradores</p></td>
-<td align="center" valign="top"><p class="table">Via memória</p></td>
-</tr>
-</tbody>
-</table>
-</div>
-<div class="paragraph"><p>Como as arquiteturas RISC visam Unidades de Controle mais simples, rápidas e baratas, elas geralmente optam por instruções mais simples possível, com pouca variedade e com poucos endereços.
-A pouca variedade dos tipos de instrução e dos modos de endereçamento, além de demandar uma Unidade de Controle mais simples, também traz outro importante benefício, que é a previsibilidade.
-Como as intrusões variam pouco de uma para outra, é mais fácil para a Unidade de Controle prever quantos ciclos serão necessários para executa-las.
-Esta previsibilidade traz benefícios diretos para o ganho de desempenho com o Pipeline.
-Ao saber quantos ciclos serão necessários para executar um estágio de uma instrução, a Unidade de Controle saberá exatamente quando será possível iniciar o estágio de uma próxima instrução.</p></div>
-<div class="paragraph"><p>Já as arquiteturas CISC investem em Unidades de Controle poderosas e capazes de executar tarefas complexas como a Execução Fora de Ordem e a Execução Superescalar.
-Na execução Fora de Ordem, a Unidade de Controle analisa uma sequência de instruções ao mesmo tempo.
-Muitas vezes há dependências entre uma instrução e a seguinte, impossibilitando que elas sejam executadas em Pipeline.
-Assim, a Unidade de Controle busca outras instruções para serem executadas que não são as próximas da sequência e que não sejam dependentes das instruções atualmente executadas.
-Isso faz com que um programa não seja executado na mesma ordem em que foi compilado.
-A Execução Superescalar é a organização do processador em diversas unidades de execução, como Unidades de Pontos Flutuante e Unidades de Inteiros.
-Essas unidades trabalham simultaneamente.
-Enquanto uma instrução é executada por uma das unidades de inteiros, outra pode ser executada por uma das unidades de Pontos Flutuantes.
-Com a execução Fora de Ordem junto com a Superescalar, instruções que não estão na sequência definida podem ser executadas para evitar que as unidades de execução fiquem ociosas.</p></div>
-<div class="paragraph"><p>Estas características de complexidade tornam os estágios de Pipeline dos processadores CISC mais longos, em torno de 20 a 30 estágios.
-Isto porque estas abordagens de aceleração de execução devem ser adicionadas no processo de execução.
-Já os processadores RISC trabalham com estágios mais curtos, em torno de 4 a 10 estágios.</p></div>
-<div class="paragraph"><p>Os processadores CISC também utilizam mais memória principal e Cache, enquanto que os processadores RISC utilizam mais registradores.
-Isso porque os processadores CISC trabalham com um maior volume de instruções e dados simultaneamente.
-Esses dados não poderiam ser armazenados em registradores, devido à sua elevada quantidade e são, geralmente, armazenados em memória Cache.
-Enquanto que os processadores RISC trabalham com menos instruções e dados por vez, o que possibilita a utilização predominante de registradores.</p></div>
-<div class="sect3">
-<h4 id="_afinal_qual_a_melhor_abordagem">Afinal, qual a melhor abordagem?</h4>
-<div class="paragraph"><p>Sempre que este assunto é apresentado aos alunos, surge a pergunta crucial sobre qual é a melhor abordagem, a RISC e a CISC.
-Esta é uma pergunta difícil e sem resposta definitiva.
-A melhor resposta que acho é de que depende do uso que se quer fazer do processador.</p></div>
-<div class="paragraph"><p>Processadores RISC geralmente resultam em projetos menores, mais baratos e que consumem menos energia.
-Isso torna-os muito interessante para dispositivos móveis e computadores portáteis mais simples.
-Já os processadores CISC trabalham com clock muito elevado, são mais caros e mais poderosos no que diz respeito a desempenho.
-Entretanto, eles são maiores e consomem mais energia, o que os torna mais indicados para computadores de mesa e notebooks mais poderosos, além de servidores e computadores profissionais.</p></div>
-<div class="paragraph"><p>Os processadores CISC iniciaram com processadores mais simples e depois foram incorporando mais funcionalidades a esses processadores.
-Os fabricantes, como a Intel e a AMD precisavam sempre criar novos projetos mas mantendo a compatibilidade com as gerações anteriores.
-Ou seja, o Conjunto de Instruções executado pelo 486 precisa também ser executado pelo Pentium para os programas continuassem compatíveis.
-O Pentium IV precisou se manter compatível ao Pentium e o Duo Core é compatível com o Pentium IV.
-Isso tornou o projeto dos processadores da Intel e AMD muito complexos, mas não pouco eficientes.
-Os computadores líderes mundiais em competições de desempenho computacional utilizam processadores CISC.</p></div>
-<div class="paragraph"><p>Já o foco dos processadores RISC está na simplicidade e previsibilidade.
-Além do benefício da previsibilidade do tempo de execução ao Pipeline, ele também é muito interessante para aplicações industriais.
-Algumas dessas aplicações são chamadas de Aplicações de Tempo Real.
-Essas aplicações possuem como seu requisito principal o tempo para realizar as tarefas.
-Assim, o Sistema Operacional precisa saber com quantos milissegundos um programa será executado.
-Isso só é possível com processadores RISC, com poucos estágios de Pipeline, poucos tipos de instrução, execução em ordem etc.
-Mesmo que os processadores RISC sejam mais lentos do que os CISC, eles são mais utilizados nessas aplicações críticas e de tempo real, como aplicações industriais, de automação e robótica.</p></div>
-</div>
-</div>
-<div class="sect2">
-<h3 id="_recapitulando_4">Recapitulando</h3>
-<div class="paragraph"><p>Este capítulo apresentou uma etapa de extrema importância no projeto de um processador, que é a definição do Conjunto de Instruções.
-O Conjunto de Instruções define não apenas como os programas serão compilados, mas também características críticas e de mercado, como tamanho, consumo de energia e preço.</p></div>
-</div>
-<div class="sect2">
-<h3 id="_atividades_2">Atividades</h3>
-<div class="olist arabic"><ol class="arabic">
-<li>
-<p>
-Texto da atividade.
-</p>
-</li>
-<li>
-<p>
-Texto da atividade.
-</p>
-</li>
-<li>
-<p>
-Texto da atividade.
-</p>
-</li>
-</ol></div>
-<div class="admonitionblock">
-<table><tr>
-<td class="icon">
-<div class="title">Atenção</div>
-</td>
-<td class="content"><strong>Sempre termine os arquivos com uma linha em branco</strong>, caso
-contrário você poderá encontrar erros inesperados.</td>
-</tr></table>
-</div>
-</div>
-</div>
-</div>
-<div class="sect1">
-<h2 id="glossario">Glossário</h2>
-<div class="sectionbody">
-<div class="dlist glossary"><dl>
-<dt>
-<a id="PC"></a> PC (Program Counter)
-</dt>
-<dd>
-<p>
-Contador de Programas (<a href="#sec_registradores">[sec_registradores]</a>).
-</p>
-</dd>
-<dt>
-<a id="IR"></a> IR (Instruction Register)
-</dt>
-<dd>
-<p>
-Registrador de Instrução (<a href="#sec_registradores">[sec_registradores]</a>).
-</p>
-</dd>
-<dt>
-<a id="MAR"></a> MAR (Memory Address Register)
-</dt>
-<dd>
-<p>
-Registrador de Endereço (<a href="#sec_registradores">[sec_registradores]</a>).
-</p>
-</dd>
-<dt>
-<a id="MBR"></a> MBR (Memory Buffer Register)
-</dt>
-<dd>
-<p>
-Registrador de Dados (<a href="#sec_registradores">[sec_registradores]</a>).
-</p>
-</dd>
-<dt>
-<a id="ULA"></a> ULA
-</dt>
-<dd>
-<p>
-Unidade Lógica e Aritmética (<a href="#sec_ULA">[sec_ULA]</a>).
-</p>
-</dd>
-<dt>
-<a id="UC"></a> UC
-</dt>
-<dd>
-<p>
-Unidade de Controle (<a href="#sec_UC">[sec_UC]</a>).
-</p>
-</dd>
-<dt>
-<a id="FI"></a> FI
-</dt>
-<dd>
-<p>
-Ciclo carregar instrução. Traz a instrução da memória para o
-processador, armazena em <a href="#IR">[IR]</a> (essa etapa também é chamada de <em>Fetch
-de Instrução</em>) e a decodifica para execução no passo seguinte. (<a href="#sec_pipeline_desempenho">[sec_pipeline_desempenho]</a>)
-</p>
-</dd>
-<dt>
-<a id="FO"></a> FO (Fetch operands)
-</dt>
-<dd>
-<p>
-Clico carregar operandos. Traz os operandos da operação dos
-registradores para a ULA, para que a operação seja realizada sobre
-eles, também chamada de <em>Fetch de Operandos</em>. (<a href="#sec_pipeline_desempenho">[sec_pipeline_desempenho]</a>)
-</p>
-</dd>
-<dt>
-<a id="EI"></a> EI (Execute Instructions)
-</dt>
-<dd>
-<p>
-Ciclo executar instruções. Executa operação lógica ou aritmética
-propriamente dita. (<a href="#sec_pipeline_desempenho">[sec_pipeline_desempenho]</a>)
-</p>
-</dd>
-<dt>
-<a id="WM"></a> WM (Write to memory):: Ciclo escrever em memória
-</dt>
-<dd>
-<p>
-Escreve o resultado da operação em
-memória, se necessário. (<a href="#sec_pipeline_desempenho">[sec_pipeline_desempenho]</a>)
-</p>
-</dd>
-<dt>
-<a id="WR"></a> WR (Write to register)
-</dt>
-<dd>
-<p>
-Ciclo escrever em registrador. Escreve o resultado da operação
-em um dos registradores, se necessário. (<a href="#sec_pipeline_desempenho">[sec_pipeline_desempenho]</a>)
-</p>
-</dd>
-</dl></div>
-</div>
-</div>
-</div>
-<div id="footnotes"><hr /></div>
-<div id="footer">
-<div id="footer-text">
-Last updated 2014-04-19 12:48:58 BRT
-</div>
-</div>
-</body>
-</html>

Tipo de instrução	CPI	Número de instruções
Aritmética com Inteiros	1	45.000
Operações de acesso à Memória	4	32.000
Operações com Ponto Flutuante	2	15.000
Instruções de salto e desvio	5	8.000
Endereço	Instrução ou Dado
FF01	A = B * C
FF02	B = A + 2
FF03	15 // valor de A
FF04	2 // valor de B
FF05	4 // valor de C
Características	RISC	CISC
Arquitetura	Registrador-Registrador	Registrador-Memória
Tipos de Dados	Pouca variedade	Muito variada
Formato das Instruções	Instruções poucos endereços	Instruções com muitos endereços
Modo de Endereçamento	Pouca variedade	Muita variedade
Estágios de Pipeline	Entre 4 e 10	Entre 20 e 30
Acesso aos dados	Via registradores	Via memória