quinta-feira, 26 de agosto de 2021

Horários de Consulta - 019-988-627-438 Whatsapp

 Horários de Consulta:

- No Google Meet Permante: zwz-pbzr-qkx

- Sábados das 16:30 as 17:30

- Domingos das 16 às 17


Whatsapp:

    019-988-627-438


Site da Disciplina - Videoaulas Ordenadas e Documentadas & E-Mail para Exercícios

Site da LCE 1270 

https://sites.google.com/view/lce1270-ia-cd-gest-usp-gabriel


E-mail para enviar Exercícios:

E-Mail da Disciplina:



gestao.estat.cert@gmail.com




Exercícios

 Exercícios

Pratico 1 - Invente ou pesquise na Internet um conjunto de dados para aplicar Teste T de Student (a gente aplicou para salários de MS e SP). Arquivo do Excel e Relatório em Word ou Power Point

                 Dead Line = 2 semanas è dia 1 de setembro

Teórico 1 - Slides (12 slides, fonte do título minima 32, e do corpo do slide minima 28) Importância da Ciência de Dados, Inteligência Artificial, Machine Learning, Deep Learning, Data Mining, Big Data e Text Mining para sua profissão no mercado de trabalho.

                 Dead Line = 2 semanas è dia 1 de setembro

 

Horários de consulta 

   Sábados 16:30 as 17:30

   Domingos das 15:30 as 16:30

 


Programação em SAS - Primeiro Exemplo

Primeiro Programa SAS 

data IA;

input Tipo_IA $ LL_Ha_An;

/* MLSC: Machine Learning Superv. para Clasif. */

/* MLSP: M L Superv. para Previsão */

cards;

MLSC 1567

MLSP 1789

MLNS 1657

Todos 2567

;

/* Fim do Data Step */

/* A partir de aqui vem o Procedure Step */

Proc print data=IA;

Run;


Saída do Primeiro Programa SAS:

Control C - Control V

ObsTipo_IALL_Ha_An
1MLSC1567
2MLSP1789
3MLNS1657
4Todos2567





Importar como Figura:


Aula II

 Link Completo de Hoje:

https://meet.google.com/qir-uvtm-msx


Link Permanente: zwz-pbzr-qkx o deixaremos de utilizar hoje

Pauta:

- Site da Discipina

- Pesquisa sobre a importância do Software SAS, para sua profissão (IA - CD - BI - BD - DM - TM)

       - Elaborar dois slides por pessoa

       - Voluntários apresentam

- Exemplo de Programa SAS

- Rodar Tete T explicando Resultado

- Teste T em Dinheiro Falso

- Introdução a MLS para Previsão



Videoaulas de Regressão - Macro em Excel - EXCEL AVANÇADO

 



  Videoaulas de Regressão - Macro em Excel  - EXCEL 

                                            AVANÇADO


Base para Machine Learning Supervisionado para Previsão





Videoaula 1 - Resolvendo Graficamente e Sem Probabilidade 
( Sem Macros em Excel)

https://www.youtube.com/watch?v=HWnrEfMHOZw&feature=youtu.be





Videoaula 2 - Resolvendo com Probabilidade, Margem de Erro e Margem de Confiança, Inferência Estatística - Macro de Regressão em Excel


https://www.youtube.com/watch?v=qLbziQKSeB8&feature=youtu.be


 Propaganda - Vendas 

X

Y

30

430

21

335

35

520

42

490

37

470

2

210

8

195

17

270

35

400

25

480





Arquivo para Download








Coeficiente Angular ou Coeficiente de Regressão = 8,3
Quanto aumenta a Venda (Y) quando incremento uma unidade em Propaganda (X)

 

 

Coeficiente Linear = 170,78

Indica quanto venderei em cada unidade de negócio se não fizer propaganda (X=0) 



     Coeficiente de Determinação ou R Quadrado 

Se Coef. Determinação:
0-0,2 = Muito Ruim o Modelo
0,2-0,4 = Ruim
0,4-0,6 = Regular (nem bom nem ruim)
0,6-0,8 = Bom
0,8 - 1 = Muito Bom


coeficiente de determinação, também chamado de , é uma medida de ajustamento de um modelo estatístico linear generalizado, como a Regressão linear, em relação aos valores observados. O R² varia entre 0 e 1, indicando, em percentagem, o quanto o modelo consegue explicar os valores observados. Quanto maior o R², mais explicativo é modelo, melhor ele se ajusta à amostra.
Por exemplo, se o R² de um modelo é 0,8234, isto significa que 82,34% da variável dependente (Y) consegue ser explicada pelos regressores (X) presentes no modelo. Fonte Wikipedia.



Regressão Linear é um dos modelos mais atrativos devido a sua representação entendível, no caso da regressão linear simples sua utilização é mais para aprendizado, já que na prática ela não é muito aplicada, visto que, em muitos casos a gama de variáveis de entradas é maior, fazendo-se uso da Regressão Linear Multivariável, ao qual não adentraremos nesse post. O modelo de representação da regressão linear simples é a tradicional equação conhecida como equação da reta ou em inglês slope-intercept form, usaremos a notação mais utilizada em exemplos de Machine Learning e não da matemática, mas você pode saber mais sobre a própria equação neste link.
Temos o y a variável dependente que representa a predição, as letras gregas β (Beta), também conhecidos como coeficientes, que são a representação das variáveis que o algoritmo irá utilizar para “aprender” a produzir as previsões mais precisas e o x a variável independente que representa o dado de entrada. As letras gregas β também são conhecidas como inclinação e interceptação ou em inglês intercept-slope.

Função de custo


Função de custo, no inglês cost function ou ainda ordinary least squares é uma função utilizada para medir o quão errado o modelo está, os chamados resíduos. Isto é, consiste no cálculo da distância de cada ponto (distância essa entre as variáveis x e y) em relação a reta de regressão, esse valor é elevado ao quadrado e somado, o total é a quantidade média de erro do modelo.

Inteligência Artificial - Conceito - Categorias

 Inteligência Artificial - Conceito - Categorias


IA - Indutiva

     - Machine Learning Supervisionado para Classificação - Dinheiro Falso - Teste T

     - Machine Learning Supervisionado para Previsão - Regressão

     - Machine Learning Não Supervisionado

     - Deep Learning

IA - Dedutiva 

     - Utiliza conhecimento consolidado



Slides
























Teste T de Student no SAS - ANOVA e Robust ANOVA

 Dinâmica

Colar Programa



Teste T de Student - Macro em Excel ou Ferramentas de Analise (Cientifica ou Financeira)

  Teste T de Student - Macro em Excel ou Ferramentas de Analise (Cientifica ou Financeira)

- Salarios MS Vs SP


Videoaula:

      https://youtu.be/MNokvQqeP_c


Arquivo Elaborad o Durante a Aula para Fazer Download:

Teste_T_Excel_Salarios


Teste T de Student - O mais utilizado no dia a dia dos egressos da ESALQ no Mercado de Trabalho na Area de BI


No programa de todas as disciplinas de Estatística Básica da ESALQ:

·       


Exemplo 1:


Teste se a média aritmética dos dois estados é igual. Se existirem

 outliers elimine-os.  Analise os dados com o outlier e eliminando-o,

 compare os resultados. Discuta os resultados da analise sem o

 outlier. 


Teste T - Macro em Excel - Inferência Indutiva

Inferência Indutiva utilizando Estatística



Cidade

Estado

Salario na Industria Tático/Operacional

1

MS

1678

2

SP

1850

3

MS

1650

4

MS

1890

5

SP

1950

6

SP

2050

7

SP

2320

8

SP

1800

9

MS

1789

10

MS

1890

11

MS

1780

12

MS

2550

13

SP

2150

14

SP

1680





Arquivo do Ecxel feito em dinamica conjunta:
(Arquivo para Downoad)




Livro Introdutorio sobre Machine Learning

https://alex.smola.org/drafts/thebook.pdf


Relatório Técnico para uma Empresa (ano 2020), linguagem corporativa.

Caso 1 – Com Informação Previa Confiável (por exemplo um relatório técnico de 2019 comparando os salários dos dois estados – MS e SP)

A média salarial de SP (1971,4 Reais) foi estatisticamente superior à média de MS (1792,4 Reais) com uma margem de confiança de 95,5%.

 

Caso 2 – Sem Informação Previa Confiável (pesquisa pioneira)

A média salarial de SP não diferiu estatisticamente da média de MS, margem de confiança para falar que são diferentes 90,9% (inferior a 95%).

 

Resultados e Discussão (âmbito acadêmico Ex. USP, trabalho cientifico)

Caso 1 – Com Informação Previa Confiável (por exemplo uma referência bibliográfica importante) comparando os salários dos dois estados – MS e SP)

A média salarial de SP (1971,4 Reais) foi estatisticamente superior à média de MS (1792,4 Reais) com uma margem de erro (p valor) de 0,045.

 

Caso 2 – Sem Informação Previa Confiável (pesquisa pioneira)

A média salarial de SP não diferiu estatisticamente da média de MS (p < 0,090).



Estatística Tradicional Paramétrica

·       Inteligência Artificial (Era da IA) e Normas ISO (balizam o comercio internacional e nacional):

               Agora Estatística Robusta (fora do Excel, no SAS, R e Python)

·                                 Teste T Robusto ou Kruskal Wallis


Aula 2 - 26/8/2021

 Link Completo de Hoje:

https://meet.google.com/qir-uvtm-msx


Link Permanente: zwz-pbzr-qkx o deixaremos de utilizar hoje

Pauta:

- Pesquisa sobre a importância do Software SAS, para sua profissão (IA - CD - BI - BD - DM - TM)

       - Elaborar dois slides por pessoa

       - Voluntários apresentam

- Exemplo de Programa SAS

- Rodar Tete T explicando Resultado

- Teste T em Dinheiro Falso

- Introdução a MLS para Previsão



Site da Disciplina LCE 1270 - Videoaulas Ordenadas e Documentadas

Site de Nossa Disciplina

Videoaulas Ordenadas e Documentadas

 https://sites.google.com/view/lce1270-ia-cd-gest-usp-gabriel


Exemplo da Estrutura do Site:


Videoaulas da Disciplina LCE 1270



- Assunto: Rodando o Weka (ML S para Classificação). Exemplo da falsificação de Dinheiro

- Data: 19/8/2021

- Link Youtube: https://youtu.be/9kmB2roNLNA


- Assunto: Introdução à IA – Exemplo do Dinheiro Falso

- Data: 19/8/2021

- Link Youtube: https://youtu.be/yCOXF1N5YZw

quinta-feira, 19 de agosto de 2021

Exercícios

Exercícios

Pratico 1 - Invente ou pesquise na Internet um conjunto de dados para aplicar Teste T de Student (a gente aplicou para salários de MS e SP). Arquivo do Excel e Relatório em Word ou Power Point

                 Dead Line = 2 semanas è dia 1 de setembro

Teórico 1 - Slides (12 slides, fonte do título minima 32, e do corpo do slide minima 28) Importância da Ciência de Dados, Inteligência Artificial, Machine Learning, Deep Learning, Data Mining, Big Data e Text Mining para sua profissão no mercado de trabalho.

                 Dead Line = 2 semanas è dia 1 de setembro

 

Horários de consulta 

   Sábados 16:30 as 17:30

   Domingos das 15:30 as 16:30