Showing posts with label ASM. Show all posts
Showing posts with label ASM. Show all posts

Wednesday, December 13, 2017

Optimizarea alocării de memorie la definirea operanzilor

În limbajul de asamblare operanzii care se definesc folosesc descriptorii care au următoarele lungimi și restricții de aliniere:
dt - operandul are lungime de 10 bytes și adresa trebuie să fie un număr divizibil prin 2;
dq - operandul are lungime de 8 bytes și adresa trebuie să fie un număr divizibil prin 8;
dd - operandul are lungime de 4 bytes și adresa trebuie să fie un număr divizibil prin 4;
dw - operandul are lungime de 2 bytes și adresa trebuie să fie un număr divizibil prin 2;
db- operandul are lungime de 1 byte și adresa trebuie să fie un număr divizibil prin 1.
Dacă într-un program ASM se scriu primii operanzii definiți cu descriptorul dq apoi cei cu descriptorul dd, apoi cei cu descriptorul dt și  dw, iar numai în final toți operanzii cu descriptorul db contotul de locații va efectua amplasări compacte, pentru că sunt respectate cerințele de divizibilitate.
În secvența:

a              dq      15
b              dq      31
c              dq      100
x1            dw     40
x2            dw     110
x3            dw     564
y1            dt       4000
y2            dt       8000
z1            db       11
z2            db       3
z3            db       111
z4            db       1
se alocă 3*8+3*4+2*10+4*1 = 60 de bytes.
Dacă se construiește secvența:
a              dq      15
z1            db       11
b              dq      31
z2            db       3
c              dq      100
x1            dw     40
z3            db       111
x2            dw     110
x3            dw     564
y1            dt       4000
z4            db       1
y2            dt       8000
rezultatul este absolut nefavorabil pentru că necesarul de zonă de memorie va impune alinieri și deci bytes neutilizați. În cazul operanzilor care nu sunt aliniați se vor executa operațiile dar forțarea necesită cicluri suplimentare.
Lungimea se calculează după expresia:
L = 8+1+7+8+1+7+8+2+1+1+2+2+10+10= 75 bytes.
Cei 15 bytes apar pentru a fi respectată cerința de aliniere, adică divizibilitatea cerută de descriptori. În acest caz este vorba de un supliment de memorie care se evită prin regruparea tipurilor de operanzi. dacă însă un operand este definit la o adresă impară, el va fi referit cu un număr mai mare de cicluri mașină, ceea ce scade eficiența prelucrării.
Optimizarea alocării de memorie la definirea operanzilor este un mod de a face economie de memorie și de a reduce numărul de cicluri mașină, știindu-se că în assembler se face orice, cu orice. Totul depinde de programator.






(13 decembrie 2017)

Sunday, November 12, 2017

Structurarea pe blocuri

Limbajele de programare permit implementări care asigură încărcarea echilibrată a membrilor unei echipe de programatori, ceea ce înseamnă că aceștia au posibilitatea de a lucra cu unități de program numite fie module, fie blocuri, fiecare dintre ele având reguli proprii de asamblare a părților în întreg.
Sunt limbaje în care se lucrează cu blocuri delimitate prin acolade, {,  }.
Sunt limbaje care permit lucru cu subprograme care se constituie în entități independente.
Sunt limbaje care sunt structurate pe secvențe delimitate prin etichete.
Indiferent cum stau lucrurile, trebuie definite variabile pe diferite niveluri și gestionat conținutul acestora astfel încât să nu apară rezultate imprevizibile. Limbajele PASCAL și C operează cu variabile locale în raport cu blocul definit prin acolade, fiind considerate variabile locale, întrucât alocarea lor se realizaeză la intrarea în bloc și care se dealocă la ieșirea din bloc.


În lucru acum
(13 noiembrie 2017)

Alcătuirea bibliotecilor standard

Limbajele de programare au biblioteci standard care sunt asociate programelor prin comanda include.
Limbajul PASCAL conține biblioteci pentru:
- conversii;
- calcule matematice abs(), odd(), sqr(), sqrt(), sin(), cos(), ln(), exp();
- alocare dinamică a memoriei new, dispose, ;
- șiruri de caractere StrConcat(), StrDelete(), StrInsert(), StrLen(), StrScan(), StrSize(),
  SubStr(),Delete(), Insert(), Copy(), Length(), Str();
- lucru cu pointeri address(), Ofs(), Addr(), RawPointer(), peek(), poke(), Move(), Seg();
- generare numere pseudoaleatoare initrandom(), random();
- funcții pe mulțimi succ(), pred();
Limbajul  are biblioteci pentru:
- funcții matematice care se inserează în programe cu <math.h>;
- funcții de manipulare șiruri care se inserează în programe cu<string.h>;
- funcții matematice cu numere complexe se inserează în programe cu <complex.h>;
- funcții de gestiune a timpului din calculator care se inserează în programe cu <time.h>.
Limbajul C conține cu mult mai multe biblioteci precum <stdio.h>, <limits.h>, <stddef.h> și multe altele. Este necesar după ce programatorul se familiarizează cu limbajul să treacă la studierea acestor biblioteci și cu mare atenție să vadp ce parametri au funcțiile, dar mai elas ce returnează ele, căci el are posibilitatea de a exploata acele rezultate returnate, precum se întâmplă la instrucțiunile de citire scriere dar și la cele de deschidere, repsectiv de închidere de fișiere unde numărul returnat dă informații prețioase pe care programatorul le introduce inteligent în expresii condiționale și după aceea în secvențe compuse în care apare if(), neinițiații mirându-se siderați.



În lucru acum
(13 noiembrie 2017)

Sintaxa limbajului

Înainte de orice, programatorul trebuie să citească cu atenție regulile de sintaxă ale limbajului pentru a ști:
- ce să ceară limbajului;
- ce are voie să scrie în programe;
- care este lista de cuvinte cheie;
- care este setul de caractere utilizat;
- ce nu are voie să construiască;
- cum se termină o instrucțiune;
- ce rol alre spațiul între cuvinte;
- care este diferența între - și _;
- cum se scriu comentariile;
- ce este obligatoriu și ce nu.
Sunt definite complet folosind diferite modalități toate limbajele de programare. Cel mai frecvent este folosită pentru a descrie sintaxa unui limbaj BNF - Backus-Naur Form.
Pentru expresiile unare din limbajul C se propune definirea:
<unary-expression> ::= <postfix-expression>
                     | ++ <unary-expression>
                     | -- <unary-expression>
                     | <unary-operator> <cast-expression>
                     | sizeof <unary-expression>
                     | sizeof <type-name>
Toate celelalte definiri sunt date la adresa, unde construcțiile se realizează din aproape în aproape. Intrând pe Internet se găsesc definirile BNF pentru toate limbajele de programare. Este esențial să se citească și elementele cantitative referitoare la lungimi, complexități și niveluri de indirectare.
În FORTRAN numărul maxim de dimensiuni este 7 pentru masive.
În limbajul C numărul maxim al nivelurilor de indirectare este 3.
În COBOL lungimea etichetelor nu depășește 31 de caractere.


În lucru acum
(13 noiembrie 2017)

Implementarea structurilor fundamentale de control


Structurile fundamentale sunt:

  • structura liniară în care instrucțiunile se execută una după cealaltă;
  • structura alternativă în care se produce o selecție funcție de care se execută una sau alta dintre instrucțiuni, după care se revine la execuție în secvență:
  • structura repetitivă în care o anumită secvență de instrucțiuni se execută de mai multe ori, fie că numărul de repetări este cunoscut, fie până când o condiție este îndeplinită și numărul de repetări nu este cunoscut de dinainte;
  • structura alternativă multiplă care presupune selectarea dintre mai multe secvențe de instrucțiuni a uneia care se execută la un moment dat, după care se revine la execuția în secvență a altor instrucțiuni.

De la limbaj la limbaj există diferite implementări ale acestor structuri de control și am mari dubii că sunt prea multe limbajele în care să nu existe instrucțiunea IF() THEN....ELSE.
Limbajul de asamblare conține tot felul de implementări și încă libere ale structurilor de control. Dacă în FORTRAN nu sunt permise intersecțiile de domenii în secvențele de program scrise în limbaj de asamblare așa ceva este permis. În limbajele de asamblare însă se construiesc secvențele pas cu pas, prin evaluări de expresii, comparări și salturi necondiționate cât îi poftește inima programatorului. Chiar dacă există instrucțiunea LOOP programatorul o gestionează chiar cum vrea el sau o ignoră construind repetitivitatea după pofta inimii cu evaluări, comparări și salturi condiționate combinate cu salturi necondiționate.
Limbajul FORTRAN implementează structurile fundamentale de control destul de ușor și simplu. Pentru structura alternativă implementarea este  prin:
IF(expresie) eticheta1,eticheta2,eticheta3
unde:
eticheta- dirijează execuția spre o secvență dacă expreia evaluată este mai mică decât  zero;
eticheta- dirijează execuția spre o secvență dacă expreia evaluată este egală cu zero;
eticheta3 - dirijează execuția spre o secvență dacă expreia evaluată este mai mare ca zero.
Structura repetitivă este implementată cu construcția:
                 DO eticheta  variabila_control = valoare_inițială, valoare_finală, rație
                 ......................
eticheta    ultima_instrucțiune_repetată
unde:
eticheta  - delimitează sfârșitul secvenței de repetat care începe după instrucțiunea DO;
variabila_control  - variabila cu care se gestionează numărul repetărilor, căci nivelul este între valoarea inițială și valoarea finală;
valoare_inițială - valoarea de start a variabilei de control;
valoare_finală - este valoarea limită superioară care nu este depășită de variabila de control; în caz de depășire repetarea este întrerultă;
rație - este o constantă sau o variabilă care arată cu cât se modifică variabila de control la iterația următoare.
Astructura alternativă multiplă este implementată în acest limbaj cu ceea ce se numea GO TO calculat, o construcție de forma:
GO TO (eticheta1, eticheta2, eticheta3,...., etichetan), variabilă_control
în care:
etichetai  -  arata la ce instrucțiune se face saltul dacă variabila_control este egală cu i:
variabila_control - este variavila care are valori cuprinse între 1 și n.
Acest limbaj nu are structura repetitivă condiționată anterior DO-WHILE și nici pe dea condiționată posterior, DO-UNTIL. Acestea se simulează folosind IF() și o întrețesere de instrucțiuni GO TO, ceea ce programarea structurată implementată forțat pentru FORTRAN IV se străduia să facă greoi, aproape imposibil de acceptat.
Limbajul C dispune de tot tacâmul de construcții pentru a implementa toate structurile de control fără mari probleme și tocmai de aceea a fost acceptat ca fiind un limbaj complet, ușor și prietenos.
Structura liniară este implementată folosind expresii aritmetice, expresii de atribuire dar și apeluri de funcții.
Structura alternativă este implementată folosind construcția:
if (expresie) {
                      secventa1;
                     }
                      else
                     {
                      secventa2;
                      }
dacă după evaluarea expresiei se obține că este adevărată se execută secventa1, În caz contrar se execută secventa2. Se observă că lipsește then pentru a selecta secventa1, lucru nenecesar, ci presupus, că nu tot ceea ce este în vorbirea curentă trebuie preluat în limbaj.
        

În lucru acum
(13 noiembrie 2017)

Modul de implementare a recursivității

Limbajul FORTRAN nu are implementată recursibitatea.
Limbajul COBOL nu are implementată recursibitatea.
Limbajul ALGOL nu are implementată recursibitatea.
Limbajul PASCAL are implementată recursibitatea chiar la nivel de definire de variabile.
Limbajul C are implementată recursibitatea chiar la nivel de definire de variabile.
Limbajele de  asamblare implementează recursibitatea prin gestionarea stivelor de către programator.



În lucru acum
(13 noiembrie 2017)

Modul în care se scriu comentariile

Cei ce au făcut mentenanță în programe FORTRAN și COBOL știu pe pielea lor de programatori care au fost binefacerile introducerii de comentarii în programe care au lămurit:
- semnificația datelor definite;
- semnificația secvențelor de prelucrare;
- localizarea sursei unde se află formulele de calcul;
- legislația care a stat la baza unor blocuri decizionale;
- numele programatorilor care au realizat textele;
- semnificația unor constante folosite pentru diferite stări;
- semnificația codurilor utilizate;
- restricții privind pentru definirile  parametrilor.
În limbajul FORTRAN comentariile sunt date de litera C pe prima coloană a formularului de programare.
În limbajul C pentru comentarii există două modalități de a le introduce:
- dacă se dorește mai multe linii de comentarii succesive se folosesc /* pentru debut și */ pentru final;
- dacă se dorește comentariu pentru o linie sursă se scrie un text oarecare după //.
În limbajul PASCAL comentariile se introduc prin (* texte oarecare *) sau  {*text oarecare *}, iar dacă se dorește pe linia unei instrucțiuni să se introducă un text se scrie // text oarecare.
În limbajele de asamblare comentariile diferă de la calculator la calculator.În limbajul ASSEMBLER al IBM comentariile încep cu un asterisc pe prima coloană. În limbajul ASSIRIS comentariul este și el la loc de cinste. În limbajul ASM cel folosit acum de toate PC-urile comentariile au în fața textului punct și virgulă, adică ; permițând scrierea în acest fel de texte pe o line dar și după fiecare instrucțiune pentru a lămuri semnificația acesteia.



În lucru acum
(13 noiembrie 2017)

Regula de evaluare a expresiilor

Limbajele de programare au operanzi și operatori cu care construiesc expresii mai complexe sau mai puțin complexe. Există o singură regulă de evaluare a expresiilor, indiferent care sunt acestea și această regulă vizează:
- prioritatea operatorilor;
- sensul de parcurgere în procesul de evaluare.
Pentru limbajul C există tabelul:
PrioritateaOperatorDescriereaAsociativitatea
1++ --Post incrementare, respectiv decrementare 
Stânga la dreapta
()Apel funcție
[]Definire în masiv
.Referire membru în articol
->accesare pointeri în structuri
(type){list}Compunere literali
2++ --Pre Incrementare și pre decrementareDreapta la stânga
+ -Operatori unari
! ~negarea logică NOT și complement pe biți NOT
(type)Tipul
*Referirea lui
&Adrea lui
sizeofLungimea lui
_AlignofAliniere impusă
3* / %Înmulțire, împărțire și împărțire cu restStânga la dreapta 
4+ - Adunare și scădere
5<< >>Deplasare pe biți
6< <=Operatorul relațional  <  și ≤
> >=Operatorul relațional  >  și ≥ 
7== !=Operatorul relațional =  și  ≠ 
8&Operatorul și pe bițiAND
9^Operatorul logic sau exclusiv  XOR (exclusive or)
10|Operatorul logic sau iclusiv OR 
11&&Operatorul logic AND
12||Operatorul logic OR
13?:Operatorul ternarDreapta la stânga
14=Simple assignment
+= -=Assignment by sum and difference
*= /= %=Atribuire cu operații aritmetice
<<= >>=Atribuirea cu deplasare biți spre stânga, dreapta
&= ^= |=Atribuirea cu operații pe biți AND, XOR, and OR
15,VirgulaStânga la dreapta
Expresiile din parantezele rotunde se evaluează primele.
Expresia *alfa++ se evaluează *(alfa++) pentru că postincrementarea are prioritatea 1, iar operatorul de referire are prioritatea 2.
Expresia  a=3, b=5, c=7;
se evaluează de la stânga spre dreapta căci operatorul virgulă așa cere.  Se evaluează mai întâi atribuirea a=3, apoi se inițializează  b și la urmă se evaluează expresia c=7.
Expresia:
e = a < d ? a++ : a = d
se evaluează astfel:
e = ( ((a < d) ? (a++) : a) = d )
Operatorul = are prioritatea 14 și presupune evaluare de la stânga la dreapta.
Operatorul < are prioritatea 6.
Operatorul  de postincrementare ++ are prioritatea 1.
Operatorul ?: are prioritatea 13.
Se evaluează expresia a<d.
Dacă rezultatul evaluării este adevărat are loc postincrementarea și apoi e=a.
Dacă rezultatul evaluării nu este adevărat are loc atribuirea e=d.

În lucru acum
(13 noiembrie 2017)

Lista de operatori și rangurile lor

Un limbaj diferă de altul prin lista de operatori, listă care dă puterea unui limbaj. Operatorii sunt cei care spun de fapt ce se întâmplă cu zonele de memorie, până unde se merge , adică la ce nivel:
- bit;
- byte;
- șir de biți;
- cuvânt;
- dublu cuvânt;
- caracter;
- șir de caractere.
Limbajele mai slabe merg la nivel de byte și la nivel de cuvânt sau dublu cuvânt și șir de caractere. Limbajele mai sofisticate merg și în interiorul byte sau a cuvântului.
Lista operatorilor în limbajele de asamblare este dată de lista de instrucțiuni, căci fiecare cod de operație înseamnă un operator de fapt. Conchid că limbajul de asamblare are cea mai complexă listă de operatori și că în limbajul de asamblare se face orice cu orice. SE găsesc instrucțiuni pentru:
- operatorii aritmetici;
- operatorii de comparare;
- operatorii logici;
- operatorii pe șiruri de biți;
- operatori atribuire;
- operatori de inițializare;
- operatori incrementare/decrementare;
- operatorii pe șiruti de caractere.
Lista operatorilor în limbajul COBOL este  formată din:
- operatorii aritmetici + - * / **, add, subtract, multiply, divide;
- operatorii de comparare = < > <= >= <> less than, greater thac, equal to ;
- operatorii logici and, or, not ;
- operatorii pe șiruri de biți b-and, b-or, b-xor, b-not, b-left, b-right;
- operatori atribuire move, set, compute;
- operatori de inițializare move;
- operatorii pe șiruti de caractere move .
Lista operatorilor în limbajul C este  formată din:
- operatorii aritmetici +, -, *, /, %;
- operatorii de comparare == != ;
- operatorii logici !, &&, ||, or, not, ;
- operatorii pe șiruri de biți ~, &, |, ^,<<, >>  ;
- operatori atribuire compu;i +=,-=, *=,/=,%=,  |=, ^=, &=,<<=, >>= ;
- operatori de inițializare;
- operatori incrementare/decrementare ++, --;<, <=, !<, >,>=, !>
- operatori pentru membrii unei structuri agregate de date . și -> ;
- operatori cu pointeri & și *;
- operatorii pe șiruri de caractere definiți ca funcții  în biblioteca string.h.
În limbajul C virgula este operator. Există operatorul ternar ?:, dar și mulți alți operatori care sunt de fapt funcții implementate în limbaj precum sizeof(), new, delete, type și mulți alții.
Lista operatorilor în limbajul PASCAL este  formată din:
- operatori arithmetici +, -, *, /, %;
- operatori relationali =, <, <=, >, >=, <> ;
- operatori booleeni and, and  then, or, or else, not;
- operatori pe biți &, |, !, ~, <<, >> ;
- operatori pe mulțimi +, -, *, ><, <=, include, exclude, in;
- operatori pe șiruri de caractere sub forma unor funcții de bibliotecă.
Comparând listele operatorilor, se vede că limbajul C este cel mai puternic, dar după oricare alt limbaj de asamblare, deși limbajul PASCAL permite operare elegantă pe mulțimi.

În lucru acum
(13 noiembrie 2017)

Flexibilitatea de a defini tipuri și structuri de date





În lucru acum
(13 noiembrie 2017)

Setul de caractere

Fiecare limbaj are setul său de caractere.
Limbajul C are setul de caractere format din:
- literele mari de la A la Z, literele mici de la a la z;
- cifrele 0, 1, 2, 3, 4, 5, 6, 7, 8, 9;
- caracterele speciale  ~, %, |, @, +, <, _, -, >, ^, #, =, &, $, /, (, *, \, ), ′, :, [, ", ;, ], !, ,, {, ?, ., };
- caracterele denumite spații albe \b, \t, \v,  \r, \f, \n, \\, \’, \", \?, \0, \a, \x, \o.
Limbajul FORTRAN are setul de caractere format din:
- literele mari de la A la Z;
- cifrele 0, 1, 2, 3, 4, 5, 6, 7, 8, 9;
- caractere speciale ., , (, ), =, +, -, /, *, **, $, blanc.
Limbajul COBOL are setul de caractere format din:
- literele mari de la A la Z;
- cifrele 0, 1, 2, 3, 4, 5, 6, 7, 8, 9;
- caractere speciale ., , (, ), =, +, -, /, *, **,  blanc.
Limbajul PASCAL are setul de caractere format din:
- literele mari de la A la Z;
- literele mici de la a la z;
- cifrele 0, 1, 2, 3, 4, 5, 6, 7, 8, 9;
- caractere speciale ., , (, ), =, +, -, /, *, **,  blanc, {, }, [, ], ;, :, =, <. >, ~, %, $, #, !.
Semnificația caracterelor trebuie studiată cu mare atenție căci nu este obligatoriu ca un simbol să aibă aceeași semnificație la toate limbajele de programare. Se învață un limbaj cunoscând diferențele față de limbajul anterior în care a lucrat programatorul, dar acele diiferențe trebuie nu identificate, ci învățate și trebuie ținut seama de ele.
În lucru acum

(13 noiembrie 2017)