sexta-feira, 30 de agosto de 2024

Links do Site da Disciplina - Videoconferencia nos Horarios de Consulta e Watsapp do Gabriel

 Links do Site da Disciplina - Videoconferencia nos Horarios de Consulta e Watsapp do Gabriel


Link do Google Meet de Horarios de Consulta (sextas das 21 às 22 e dimingos das 17 às 18 horas)

            https://meet.google.com/xgf-jman-pyv

Whatsapp do Gabriel:

            019 - 988 - 627 - 438

quinta-feira, 29 de agosto de 2024

MLS Causas - Efeito ou Regressão ou Predição - Weka Sem Outlier

 MLS Causas - Efeito ou Regressão ou Predição - Weka Sem Outlier


 MLS Causas - Efeito ou Regressão ou Predição - Weka


Download Arquivo para Weka


@RELATION Customer

@ATTRIBUTE U_Neg REAL

@ATTRIBUTE Vendas REAL

@ATTRIBUTE Preco REAL

@ATTRIBUTE Niv_Qual REAL

@ATTRIBUTE Reclama REAL

@ATTRIBUTE NPS REAL

@ATTRIBUTE Satisf REAL

@DATA

1,65.98107775,97.8021978,96.77419355,13.58024691,98.9010989,97.82608696

2,15.83710407,98.9010989,98.38709677,12.34567901,97.8021978,98.91304348

3,8.885232415,100,100,11.11111111,100,100

4,12.46400658,98.9010989,95.16129032,12.34567901,96.7032967,96.73913043

5,80.66639243,21.97802198,19.35483871,100,2.197802198,21.73913043

6,32.16783217,23.07692308,22.58064516,97.5308642,3.296703297,23.91304348

7,23.44714109,24.17582418,24.19354839,96.2962963,2.747252747,25

8,89.9629782,24.17582418,19.35483871,95.0617284,2.197802198,26.08695652

9,31.42739613,64.83516484,56.4516129,50.61728395,65.93406593,65.2173913

10,11.22994652,65.93406593,51.61290323,49.38271605,71.42857143,66.30434783

11,77.45783628,70.32967033,53.22580645,46.91358025,63.73626374,68.47826087

12,23.89962978,68.13186813,51.61290323,45.67901235,61.53846154,67.39130435

13,7.404360346,86.81318681,80.64516129,25.92592593,90.10989011,86.95652174

14,0.287947347,87.91208791,79.03225806,24.69135802,85.71428571,85.86956522

15,83.42245989,87.91208791,77.41935484,22.22222222,90.10989011,88.04347826

16,100,86.81318681,75.80645161,25.92592593,84.61538462,84.7826087







Linear Regression Model


Satisf =


      0.2481 * Preco +

      0.1063 * Niv_Qual +

     -0.4275 * Reclama +

      0.1135 * NPS +

     57.4038





Outlier - Conventional and Robust Data Science for SML to Prediction or Regression + Weka

  Outlier - Conventional and Robust Data Science for SML to Prediction or Regression + Weka

  Conventional and Robust Data Science for SML to Prediction or Regression 

SAS Program


Data Customer;

Input Bu_Unit  Sales  Price Qu_level Claims NPS Satisfac;

Cards;

1 65.98107775 97.8021978 96.77419355 13.58024691 98.9010989 97.82608696

2 15.83710407 98.9010989 98.38709677 12.34567901 97.8021978 98.91304348

3 8.885232415 100 100 11.11111111 100 100

4 12.46400658 98.9010989 95.16129032 12.34567901 96.7032967 96.73913043

5 80.66639243 21.97802198 19.35483871 100 2.197802198 21.73913043

6 32.16783217 23.07692308 22.58064516 97.5308642 3.296703297 23.91304348

7 23.44714109 24.17582418 24.19354839 96.2962963 2.747252747 25

8 89.9629782 24.17582418 19.35483871 95.0617284 2.197802198 26.08695652

9 31.42739613 64.83516484 56.4516129 50.61728395 65.93406593 65.2173913

10 11.22994652 65.93406593 51.61290323 49.38271605 71.42857143 66.30434783

11 77.45783628 70.32967033 53.22580645 46.91358025 63.73626374 68.47826087

12 23.89962978 68.13186813 51.61290323 45.67901235 61.53846154 67.39130435

13 7.404360346 86.81318681 80.64516129 25.92592593 90.10989011 86.95652174

14 0.287947347 87.91208791 79.03225806 24.69135802 85.71428571 85.86956522

15 83.42245989 87.91208791 77.41935484 22.22222222 90.10989011 88.04347826

16 100 86.81318681 75.80645161 25.92592593 84.61538462 84.7826087

17 15.83710407 98.9010989 98.38709677 12.34567901 97.8021978 28.91304348

;

proc print; run;

/* Input Bu_Unit  Sales  Price Qu_level Claims NPS Satisfac; */

proc reg;

   model  Satisfac = Sales  Price Qu_level Claims NPS;

Run;

proc robustreg;

model Satisfac = Sales  Price Qu_level Claims NPS / diagnostic;

Run;




Rodando no Weka com o Outlier

Arquivo Weka com Outlier


Linear Regression Model

Satisf =

      0.7931 * Niv_Qual +

     15.28  


Aula IV - 28/8/2024

 Pauta:

- Ciência de Dados Conceito

- Pesquisa Lean Startup e Lean Canvas

- Dinâmica Regressão Multipla com e Sem Outlier

 


MLS Causas - Efeito ou Regressão ou Predição - Weka Sem Outlier

 MLS Causas - Efeito ou Regressão ou Predição - Weka Sem Outlier


 MLS Causas - Efeito ou Regressão ou Predição - Weka


Download Arquivo para Weka


@RELATION Customer

@ATTRIBUTE U_Neg REAL

@ATTRIBUTE Vendas REAL

@ATTRIBUTE Preco REAL

@ATTRIBUTE Niv_Qual REAL

@ATTRIBUTE Reclama REAL

@ATTRIBUTE NPS REAL

@ATTRIBUTE Satisf REAL

@DATA

1,65.98107775,97.8021978,96.77419355,13.58024691,98.9010989,97.82608696

2,15.83710407,98.9010989,98.38709677,12.34567901,97.8021978,98.91304348

3,8.885232415,100,100,11.11111111,100,100

4,12.46400658,98.9010989,95.16129032,12.34567901,96.7032967,96.73913043

5,80.66639243,21.97802198,19.35483871,100,2.197802198,21.73913043

6,32.16783217,23.07692308,22.58064516,97.5308642,3.296703297,23.91304348

7,23.44714109,24.17582418,24.19354839,96.2962963,2.747252747,25

8,89.9629782,24.17582418,19.35483871,95.0617284,2.197802198,26.08695652

9,31.42739613,64.83516484,56.4516129,50.61728395,65.93406593,65.2173913

10,11.22994652,65.93406593,51.61290323,49.38271605,71.42857143,66.30434783

11,77.45783628,70.32967033,53.22580645,46.91358025,63.73626374,68.47826087

12,23.89962978,68.13186813,51.61290323,45.67901235,61.53846154,67.39130435

13,7.404360346,86.81318681,80.64516129,25.92592593,90.10989011,86.95652174

14,0.287947347,87.91208791,79.03225806,24.69135802,85.71428571,85.86956522

15,83.42245989,87.91208791,77.41935484,22.22222222,90.10989011,88.04347826

16,100,86.81318681,75.80645161,25.92592593,84.61538462,84.7826087







Linear Regression Model


Satisf =


      0.2481 * Preco +

      0.1063 * Niv_Qual +

     -0.4275 * Reclama +

      0.1135 * NPS +

     57.4038





Outlier - Conventional and Robust Data Science for SML to Prediction or Regression + Weka

 Outlier - Conventional and Robust Data Science for SML to Prediction or Regression + Weka

  Conventional and Robust Data Science for SML to Prediction or Regression 

SAS Program


Data Customer;

Input Bu_Unit  Sales  Price Qu_level Claims NPS Satisfac;

Cards;

1 65.98107775 97.8021978 96.77419355 13.58024691 98.9010989 97.82608696

2 15.83710407 98.9010989 98.38709677 12.34567901 97.8021978 98.91304348

3 8.885232415 100 100 11.11111111 100 100

4 12.46400658 98.9010989 95.16129032 12.34567901 96.7032967 96.73913043

5 80.66639243 21.97802198 19.35483871 100 2.197802198 21.73913043

6 32.16783217 23.07692308 22.58064516 97.5308642 3.296703297 23.91304348

7 23.44714109 24.17582418 24.19354839 96.2962963 2.747252747 25

8 89.9629782 24.17582418 19.35483871 95.0617284 2.197802198 26.08695652

9 31.42739613 64.83516484 56.4516129 50.61728395 65.93406593 65.2173913

10 11.22994652 65.93406593 51.61290323 49.38271605 71.42857143 66.30434783

11 77.45783628 70.32967033 53.22580645 46.91358025 63.73626374 68.47826087

12 23.89962978 68.13186813 51.61290323 45.67901235 61.53846154 67.39130435

13 7.404360346 86.81318681 80.64516129 25.92592593 90.10989011 86.95652174

14 0.287947347 87.91208791 79.03225806 24.69135802 85.71428571 85.86956522

15 83.42245989 87.91208791 77.41935484 22.22222222 90.10989011 88.04347826

16 100 86.81318681 75.80645161 25.92592593 84.61538462 84.7826087

17 15.83710407 98.9010989 98.38709677 12.34567901 97.8021978 28.91304348

;

proc print; run;

/* Input Bu_Unit  Sales  Price Qu_level Claims NPS Satisfac; */

proc reg;

   model  Satisfac = Sales  Price Qu_level Claims NPS;

Run;

proc robustreg;

model Satisfac = Sales  Price Qu_level Claims NPS / diagnostic;

Run;




Rodando no Weka com o Outlier

Arquivo Weka com Outlier


Linear Regression Model

Satisf =

      0.7931 * Niv_Qual +

     15.28  


quinta-feira, 22 de agosto de 2024

Machine Learning Supervisionado para Predição - - Introdução: Regressão Linear Simples

 Machine Learning Supervisionado para Predição -  - Introdução: Regressão Linear Simples


 Exemplo: Propaganda - Vendas 

X

Y

30

430

21

335

35

520

42

490

37

470

2

210

8

195

17

270

35

400

25

480






Programa SAS para Regressão


data regre;
input X Y;
cards;
30 430
21 335
35 520
42 490
37 470
2 210
8 195
17 270
35 400
25 480
;
/* Modelo
    Y = X + Erro
    Y = a + b X + Erro
*/    
proc reg;
model Y = X;
run;






Resolvendo no SAS com Ciência de Dados Robusta - Programa e Dados com Outlier

data propaganda;
input X Y;
cards;
30 430
21 335
35 520
42 490
37 470
2 210
8 195
17 270
35 400
25 480
3 800     (===> Outlier) não colocar isto no programa SAS
;
proc print;
run;
proc robustreg;
model Y=X;
run;






Coeficiente Angular ou Coeficiente de Regressão = 8,3
Quanto aumenta a Venda (Y) quando incremento uma unidade em Propaganda (X)

 

 

Coeficiente Linear = 170,78

Indica quanto venderei em cada unidade de negócio se não fizer propaganda (X=0) 



     Coeficiente de Determinação ou R Quadrado 

Se Coef. Determinação:
0-0,2 = Muito Ruim o Modelo
0,2-0,4 = Ruim
0,4-0,6 = Regular (nem bom nem ruim)
0,6-0,8 = Bom
0,8 - 1 = Muito Bom


coeficiente de determinação, também chamado de , é uma medida de ajustamento de um modelo estatístico linear generalizado, como a Regressão linear, em relação aos valores observados. O R² varia entre 0 e 1, indicando, em percentagem, o quanto o modelo consegue explicar os valores observados. Quanto maior o R², mais explicativo é modelo, melhor ele se ajusta à amostra.
Por exemplo, se o R² de um modelo é 0,8234, isto significa que 82,34% da variável dependente (Y) consegue ser explicada pelos regressores (X) presentes no modelo. Fonte Wikipedia.



Regressão Linear é um dos modelos mais atrativos devido a sua representação entendível, no caso da regressão linear simples sua utilização é mais para aprendizado, já que na prática ela não é muito aplicada, visto que, em muitos casos a gama de variáveis de entradas é maior, fazendo-se uso da Regressão Linear Multivariável, ao qual não adentraremos nesse post. O modelo de representação da regressão linear simples é a tradicional equação conhecida como equação da reta ou em inglês slope-intercept form, usaremos a notação mais utilizada em exemplos de Machine Learning e não da matemática, mas você pode saber mais sobre a própria equação neste link.
Temos o y a variável dependente que representa a predição, as letras gregas β (Beta), também conhecidos como coeficientes, que são a representação das variáveis que o algoritmo irá utilizar para “aprender” a produzir as previsões mais precisas e o x a variável independente que representa o dado de entrada. As letras gregas β também são conhecidas como inclinação e interceptação ou em inglês intercept-slope.

Função de custo


Função de custo, no inglês cost function ou ainda ordinary least squares é uma função utilizada para medir o quão errado o modelo está, os chamados resíduos. Isto é, consiste no cálculo da distância de cada ponto (distância essa entre as variáveis x e y) em relação a reta de regressão, esse valor é elevado ao quadrado e somado, o total é a quantidade média de erro do modelo.

Slides - Sistemas Mundiais de Gestão

  Slides - Sistemas Mundiais de Gestão









































Articulação entre Inteligência Artificial, Ciência de Dados e Gestão Empresarial - IA Generativa

 Articulação entre Inteligência Artificial, Ciência de Dados e Gestão Empresarial - IA Generativa

Articulação entre Inteligência Artificial, Ciência de Dados e Gestão Empresarial

A interseção entre Inteligência Artificial (IA), Ciência de Dados e Gestão Empresarial está moldando o futuro dos negócios. Essa sinergia permite que as empresas extraiam valor máximo de seus dados, otimizando processos, tomando decisões mais informadas e impulsionando a inovação.

O Papel da Ciência de Dados

A Ciência de Dados serve como a ponte entre os dados brutos e a tomada de decisões. Através de técnicas estatísticas e algoritmos de aprendizado de máquina, os cientistas de dados extraem insights valiosos e padrões ocultos nos dados. Esses insights podem ser utilizados para:

  • Previsão de tendências: Antecipar a demanda de produtos, identificar oportunidades de mercado e mitigar riscos.
  • Segmentação de clientes: Criar campanhas de marketing mais personalizadas e eficazes.
  • Otimização de processos: Identificar gargalos e áreas de melhoria na cadeia de suprimentos, produção e outros processos.
  • Detecção de fraudes: Identificar transações suspeitas e prevenir perdas financeiras.

A Inteligência Artificial como Motor da Transformação

A Inteligência Artificial, por sua vez, capacita as máquinas a aprender, raciocinar e tomar decisões de forma autônoma. Ao combinar IA com a Ciência de Dados, as empresas podem desenvolver soluções mais sofisticadas e poderosas, como:

  • Chatbots e assistentes virtuais: Melhorar a experiência do cliente, automatizar tarefas e aumentar a eficiência.
  • Sistemas de recomendação: Oferecer produtos e serviços personalizados aos clientes.
  • Análise de sentimentos: Monitorar a reputação da marca e identificar as necessidades dos clientes.
  • Veículos autônomos: Revolucionar a logística e o transporte.

A Gestão Empresarial no Novo Cenário

A gestão empresarial precisa se adaptar a essa nova realidade. Os líderes empresariais devem:

  • Investir em dados: Construir uma cultura de dados na organização, coletando, armazenando e analisando dados de forma sistemática.
  • Desenvolver talentos: Contratar e desenvolver profissionais com habilidades em ciência de dados, inteligência artificial e gestão de negócios.
  • Fomentar a inovação: Criar um ambiente propício à experimentação e ao desenvolvimento de novas soluções.
  • Adotar uma abordagem ética: Garantir que o uso da IA e da ciência de dados seja responsável e transparente.

Benefícios da Articulação

A articulação entre IA, Ciência de Dados e Gestão Empresarial oferece diversos benefícios, como:

  • Aumento da eficiência: Automação de tarefas, otimização de processos e redução de custos.
  • Melhoria da tomada de decisões: Acesso a informações mais precisas e relevantes.
  • Personalização da experiência do cliente: Oferecimento de produtos e serviços mais adequados às necessidades individuais.
  • Inovação: Desenvolvimento de novos produtos, serviços e modelos de negócios.
  • Vantagem competitiva: Diferenciação no mercado e maior capacidade de adaptação às mudanças.

Em resumo, a combinação de Inteligência Artificial, Ciência de Dados e Gestão Empresarial está impulsionando uma nova era de inovação e transformação digital. As empresas que souberem aproveitar esse potencial terão uma vantagem competitiva significativa no mercado.

Gostaria de explorar algum desses tópicos com mais profundidade? Por exemplo, podemos discutir casos de uso específicos, as principais ferramentas e tecnologias disponíveis, ou os desafios e oportunidades que as empresas enfrentam ao implementar essas soluções.

Possíveis tópicos para aprofundamento:

  • Casos de uso: Aplicações práticas de IA e Ciência de Dados em diferentes setores (saúde, finanças, varejo, etc.).
  • Ferramentas e tecnologias: Plataformas de análise de dados, frameworks de aprendizado de máquina, linguagens de programação, etc.
  • Desafios: Questões éticas, privacidade de dados, falta de profissionais qualificados, etc.
  • Oportunidades: Novas oportunidades de negócios, criação de novos produtos e serviços, etc.

Machine Learning Supervisionado para Predição - - Introdução: Regressão Linear Simples

   Machine Learning Supervisionado para Predição -  - Introdução: Regressão Linear Simples


 Exemplo: Propaganda - Vendas 

X

Y

30

430

21

335

35

520

42

490

37

470

2

210

8

195

17

270

35

400

25

480






Programa SAS para Regressão


data regre;
input X Y;
cards;
30 430
21 335
35 520
42 490
37 470
2 210
8 195
17 270
35 400
25 480
;
/* Modelo
    Y = X + Erro
    Y = a + b X + Erro
*/    
proc reg;
model Y = X;
run;






Resolvendo no SAS com Ciência de Dados Robusta - Programa e Dados com Outlier

data propaganda;
input X Y;
cards;
30 430
21 335
35 520
42 490
37 470
2 210
8 195
17 270
35 400
25 480
3 800     (===> Outlier) não colocar isto no programa SAS
;
proc print;
run;
proc robustreg;
model Y=X;
run;






Coeficiente Angular ou Coeficiente de Regressão = 8,3
Quanto aumenta a Venda (Y) quando incremento uma unidade em Propaganda (X)

 

 

Coeficiente Linear = 170,78

Indica quanto venderei em cada unidade de negócio se não fizer propaganda (X=0) 



     Coeficiente de Determinação ou R Quadrado 

Se Coef. Determinação:
0-0,2 = Muito Ruim o Modelo
0,2-0,4 = Ruim
0,4-0,6 = Regular (nem bom nem ruim)
0,6-0,8 = Bom
0,8 - 1 = Muito Bom


coeficiente de determinação, também chamado de , é uma medida de ajustamento de um modelo estatístico linear generalizado, como a Regressão linear, em relação aos valores observados. O R² varia entre 0 e 1, indicando, em percentagem, o quanto o modelo consegue explicar os valores observados. Quanto maior o R², mais explicativo é modelo, melhor ele se ajusta à amostra.
Por exemplo, se o R² de um modelo é 0,8234, isto significa que 82,34% da variável dependente (Y) consegue ser explicada pelos regressores (X) presentes no modelo. Fonte Wikipedia.



Regressão Linear é um dos modelos mais atrativos devido a sua representação entendível, no caso da regressão linear simples sua utilização é mais para aprendizado, já que na prática ela não é muito aplicada, visto que, em muitos casos a gama de variáveis de entradas é maior, fazendo-se uso da Regressão Linear Multivariável, ao qual não adentraremos nesse post. O modelo de representação da regressão linear simples é a tradicional equação conhecida como equação da reta ou em inglês slope-intercept form, usaremos a notação mais utilizada em exemplos de Machine Learning e não da matemática, mas você pode saber mais sobre a própria equação neste link.
Temos o y a variável dependente que representa a predição, as letras gregas β (Beta), também conhecidos como coeficientes, que são a representação das variáveis que o algoritmo irá utilizar para “aprender” a produzir as previsões mais precisas e o x a variável independente que representa o dado de entrada. As letras gregas β também são conhecidas como inclinação e interceptação ou em inglês intercept-slope.

Função de custo


Função de custo, no inglês cost function ou ainda ordinary least squares é uma função utilizada para medir o quão errado o modelo está, os chamados resíduos. Isto é, consiste no cálculo da distância de cada ponto (distância essa entre as variáveis x e y) em relação a reta de regressão, esse valor é elevado ao quadrado e somado, o total é a quantidade média de erro do modelo.