Resumo apresentado na Matéria de Recuperação e Recomendação de Informação do PPGI 2014. Um resumo do Artigo de Borg, Runeson e Ardo (com pitadas da minha experiência profissional). Nesse artigo os autores falam sobre Rastreabilidade de Software feita de forma automatizada através de Modelos e Técnicas de Recuperação da Informação.
Presentation slides of the Public Defense of the PhD: a methodological contribution for the development of Dublin Core Application Profiles in the context of the Semantic Web. (document in Portuguese)
Current Trends and Future Directions in Technology for DevOps (Innovate 2012)Michael Elder
An overview of current solutions (2012) for enabling tighter integrations between Development & Operations teams and a look towards emerging trends (mid-late 2012) in support DevOps.
Getting software released to users can be risky, time-consuming and painful. The solution is the ability to deliver reliable software continuously through build, test and deployment automation, and through improved collaboration between developers, testers and operations. In this tutorial we will present principles and technical practices that enable teams to incrementally deliver software of high quality and value into production whenever they want, and extremely fast. The size of the project or the complexity of its code base does not matter.
In the first half of the tutorial we will introduce the concepts of continuous delivery, through continuous integration; and automation of the build, test and deployment process. We will also go through som basic principles and patterns for building automatable applications (architecture). We will cover experiences on team collaboration patterns and lastly; techniques for solving tasks such as an easy and comprehendible version control strategy.
The second half of the tutorial we will be working with automated provisioning of agile infrastructure, including the use of tools (puppet) to automate the management of testing and production environments. We will go through some scripting lessons examplifying how to implement zero-downtime deploys (… and rollback – if something goes wrong!), with examples in both bash and Ruby. Along with controlling the start, stop, restart lifecycles during deploys, we will also show some simple techniques for backups, logging, error handling, monitoring and verification of application health that can make the automation more robust.
We will also use servers "in the cloud" to demonstrate different techniques, and we hope to make it a fun day and to deliver software (examples) several times throughout the workshop.
Required knowledge: Agile/Lean basics, Linux basics, version control basics, maven basics.
What are the Cool Kids Doing With Continuous Delivery?CA Technologies
Building a solid application delivery tool chain is no easy task. The popularity of infrastructure configuration management tools like Puppet, Chef, Salt and others are a direct result of the explosion of virtual machines needing to be maintained, configured and provisioned. Learn how you can leverage these trends and combine infrastructure configuration and release automation to build an enterprise class continuous delivery solution for your business.
For more information on DevOps solutions from CA Technologies, please visit: http://bit.ly/1wbjjqX
DevOps & Security from an Enterprise Toolsmith's Perspectivedev2ops
Slides from presentation by Alex Honor and Damon Edwards at DevOps Connect at RSA 2015 in San Francisco on April 20, 2015.
Abstract:
IT organizations are feeling the squeeze from seemingly conflicting business mandates. At one moment the message is “Go Go Go. DevOps, Lean Startup, Continuous Delivery… move faster and give more people access”. The next moment the message is “Be more secure. Compliance above all. Keep us out of the press!”. Damon Edwards and Alex Honor work with many enterprises who are facing these challenges. This talk is an in the trenches view of how these companies are responding and learning to go faster and be more secure.
Presentation slides of the Public Defense of the PhD: a methodological contribution for the development of Dublin Core Application Profiles in the context of the Semantic Web. (document in Portuguese)
Current Trends and Future Directions in Technology for DevOps (Innovate 2012)Michael Elder
An overview of current solutions (2012) for enabling tighter integrations between Development & Operations teams and a look towards emerging trends (mid-late 2012) in support DevOps.
Getting software released to users can be risky, time-consuming and painful. The solution is the ability to deliver reliable software continuously through build, test and deployment automation, and through improved collaboration between developers, testers and operations. In this tutorial we will present principles and technical practices that enable teams to incrementally deliver software of high quality and value into production whenever they want, and extremely fast. The size of the project or the complexity of its code base does not matter.
In the first half of the tutorial we will introduce the concepts of continuous delivery, through continuous integration; and automation of the build, test and deployment process. We will also go through som basic principles and patterns for building automatable applications (architecture). We will cover experiences on team collaboration patterns and lastly; techniques for solving tasks such as an easy and comprehendible version control strategy.
The second half of the tutorial we will be working with automated provisioning of agile infrastructure, including the use of tools (puppet) to automate the management of testing and production environments. We will go through some scripting lessons examplifying how to implement zero-downtime deploys (… and rollback – if something goes wrong!), with examples in both bash and Ruby. Along with controlling the start, stop, restart lifecycles during deploys, we will also show some simple techniques for backups, logging, error handling, monitoring and verification of application health that can make the automation more robust.
We will also use servers "in the cloud" to demonstrate different techniques, and we hope to make it a fun day and to deliver software (examples) several times throughout the workshop.
Required knowledge: Agile/Lean basics, Linux basics, version control basics, maven basics.
What are the Cool Kids Doing With Continuous Delivery?CA Technologies
Building a solid application delivery tool chain is no easy task. The popularity of infrastructure configuration management tools like Puppet, Chef, Salt and others are a direct result of the explosion of virtual machines needing to be maintained, configured and provisioned. Learn how you can leverage these trends and combine infrastructure configuration and release automation to build an enterprise class continuous delivery solution for your business.
For more information on DevOps solutions from CA Technologies, please visit: http://bit.ly/1wbjjqX
DevOps & Security from an Enterprise Toolsmith's Perspectivedev2ops
Slides from presentation by Alex Honor and Damon Edwards at DevOps Connect at RSA 2015 in San Francisco on April 20, 2015.
Abstract:
IT organizations are feeling the squeeze from seemingly conflicting business mandates. At one moment the message is “Go Go Go. DevOps, Lean Startup, Continuous Delivery… move faster and give more people access”. The next moment the message is “Be more secure. Compliance above all. Keep us out of the press!”. Damon Edwards and Alex Honor work with many enterprises who are facing these challenges. This talk is an in the trenches view of how these companies are responding and learning to go faster and be more secure.
[José Ahirton Lopes] Minicurso - Mineração Textual e Processamento de Linguag...Ahirton Lopes
Um curso aberto de Mineração Textual e Processamento de Linguagem Natural com 16h de duração total com parte teórica e prática. Parte de um projeto maior de didática para pós graduação. Share alike.
Apresentação SIMCOP - SIMCOP – Framework para Análise de Similaridade em Sequ...Paulo Henrique Santini
Esse foi um dos meus primeiros artigos lidos e apresentados no Mestrado, SIMCOP – Um Framework para Análise de Similaridade em Sequências de Contextos.
Esquemas de metadados utilizados por repositórios digitais científicos latino–americanos e europeus: estudo preliminar - Morgana Andrade, Decio Berti Junior, Gleice Pereira, Ana Baptista
Metodologia para a análise da qualidade de Web Sites baseada em técnicas de a...Heitor Ganzeli
Defesa dissertação de metrado mestrado apresentada à escola politécnica.
Esse trabalho descreve metodologia utilizada para analisar determinado conjunto de sites e, a partir dos resultados, criar índices de para a avaliação da qualidade de sites Web.
Apresentação: CRIAÇÃO E CONSUMO DE DADOS NOS PADRÕES DA WEB SEMÂNTICA, UTILIZ...JonathanSchneider
Apresentação do TCC sobre Web Semantica do aluno Jonathan Schneider, (cabral345@hotmail.com). O trabalho completo esta em http://www.slideshare.net/JonathanSchneider/tcc-criao-e-consumo-de-dados-nos-padres-da-web-semntica-utilizando-rdf-e-jena
Nesta apresentação conto alguns erros que cometi, quais lições foram aprendidas e soluções que colocamos em prática enquanto tentávamos implatar Métodos Ágeis de Desenvolvimento de Software.
Mais conteúdo relacionado
Semelhante a Resumo sobre Recovering from a decade: a systematic mapping of information retrieval approaches to software traceability
[José Ahirton Lopes] Minicurso - Mineração Textual e Processamento de Linguag...Ahirton Lopes
Um curso aberto de Mineração Textual e Processamento de Linguagem Natural com 16h de duração total com parte teórica e prática. Parte de um projeto maior de didática para pós graduação. Share alike.
Apresentação SIMCOP - SIMCOP – Framework para Análise de Similaridade em Sequ...Paulo Henrique Santini
Esse foi um dos meus primeiros artigos lidos e apresentados no Mestrado, SIMCOP – Um Framework para Análise de Similaridade em Sequências de Contextos.
Esquemas de metadados utilizados por repositórios digitais científicos latino–americanos e europeus: estudo preliminar - Morgana Andrade, Decio Berti Junior, Gleice Pereira, Ana Baptista
Metodologia para a análise da qualidade de Web Sites baseada em técnicas de a...Heitor Ganzeli
Defesa dissertação de metrado mestrado apresentada à escola politécnica.
Esse trabalho descreve metodologia utilizada para analisar determinado conjunto de sites e, a partir dos resultados, criar índices de para a avaliação da qualidade de sites Web.
Apresentação: CRIAÇÃO E CONSUMO DE DADOS NOS PADRÕES DA WEB SEMÂNTICA, UTILIZ...JonathanSchneider
Apresentação do TCC sobre Web Semantica do aluno Jonathan Schneider, (cabral345@hotmail.com). O trabalho completo esta em http://www.slideshare.net/JonathanSchneider/tcc-criao-e-consumo-de-dados-nos-padres-da-web-semntica-utilizando-rdf-e-jena
Nesta apresentação conto alguns erros que cometi, quais lições foram aprendidas e soluções que colocamos em prática enquanto tentávamos implatar Métodos Ágeis de Desenvolvimento de Software.
Apresentação realizada no Rio de Janeiro Scrum Gathering de 2014 sobre como incluir um desenvolvedor de software cego em um Time Scrum que utiliza Gestão Visual.
Apresentação feita no Regional Scrum Gathering Rio 2016. Como nós do TRE-RJ estamos fazendo para levar os Métodos Ágeis para além das fronteiras do Desenvolvimento de Software na Administração Pública. Nessa apresentação eu, Avelino F. Gomes Filho e Sonia M. Moreira Goldzweig contamos nossa experiência de levar a filosofia DevOps no Tribunal Regional Eleitoral do Rio de Janeiro.
A arte dos slides foi construída pelo sempre excelente Máarcio Goldzweig (https://www.linkedin.com/in/mago17)
Apresentação realizada no XXI Workshop de Informática na Escola 2015 (WIE 2015).
Como a apresentação era muito curta (10 minutos) para a completa compreensão do tema recomendo a leitura do artigo em http://dx.doi.org/10.5753/cbie.wie.2015.504
Uma breve descrição sobre como a pornografia acontece na internet, os perigos aos quais os jovens estão expostos e algumas formas de evitá-la. Apresentação sobre Segurança da Informação e Proteção da Criança e Adolescente realizada a convite do Ministério de Homens da Igreja Assembleia de Deus Ministério Kairos, Rio de Janeiro, RJ, Brasil.
Presentation held at Agile 2015, August 4, Washington DC. It presents an Action Research that sought to include a blind software developer in an Agile team that uses visual management.
Apresentação feita no dia 13/08/2015, no Scrum Gathering Rio 2015, contando um pouco do caso de adoção de Métodos Ágeis pela Seção de Desenvolvimento de Sistemas (SEDSIS) do TRE-RJ.
"Rio de Janeiro C2 Center dealing with the unexpected: resilience and brittleness during FIFA Confederation Cup" presentation done at The 11th International Conference on Information Systems for Crisis Response and Management
(ISCRAM 2014)
Em coautoria com Júlio Cesar Rodrigues dos Santos
Sinais fracos e difusos são inerentes ao sistema. Um sistema resiliente deve ser capaz de detectá-los e para isso um numero significativo de agentes, sistemas e processos deve ser utilizado para evitar o "drift to failure"
Em coautoria com Julio Cezar Rodrigues dos Santos.
Narrando a emergência de um consenso confuso
Alertas e recomendações sobre resiliência em sistemas complexos.
4. “Software é um local onde sonhos são plantados
e pesadelos são colhidos, um pântano abstrato e
místico onde terríveis demônios competem em
uma panaceia mágica, um mundo de
lobisomens e balas de prata.”
Roger S. Pressman apud Brad J. Cox (2010)
Software Engineering: A Practitioner’s Approach, 7th Ed.
8. Rastreabilidade
• Uma das formas de aumentar a qualidade do
software é manter a ligação entre
– Código-fonte
– Regras de Negócio
– Processos de Negócio
– Requisitos
– Change Request
– Etc.
9. Rastreabilidade
“A habilidade de interrelacionar qualquer
artefato de engenharia de software que possa
ser unicamente identificado; manter as ligações
entre eles através do tempo; e utilizar a rede de
interrelacionamento para responder a perguntas
do produto de software e do processo de
desenvolvimento”.
Cleland-Huang et al. Apud CoEST (2014)
Software Traceability: Trends and Future Directions
Proc. of the 36th International Conference on Software Engineering (ICSE)
15. O Artigo
• Escrito por:
– Borg, Markus
– Runeson, Per
– Ardö, Anders
• Em 2013
• Publicado na Springer - Empirical Software
Engineering
• DOI: 10.1007/s10664-013-9255-y
16. O Artigo
• Você deve ler esse artigo porque...
– está interessado no tema Rastreabilidade e
Recuperação da Informação.
– a introdução é um excelente glossário com
referências sobre Recuperação da Informação
– o artigo descreve muito bem como fazer um
mapeamento sistemático.
17. Introdução
(Glossário com Referências)
Dataset
Bag-of-Words
Natural Language and NL
Processing
Algebraic-IR
Vector Space Model
Binary and Frequency Terms
TF-IDF
Latent Semantic Indexing
Rocchio Method
Binary Independence Retrieval
Probabilistic IR
Probabilistic Inference
Network
Statistical Language Models
Thesaurus
Precision – Recall
Recovery Effort Index
Mean Average Precision
Discounted Cumulative Gain
ETC…
19. O Artigo
Objetivo fazer um mapeamento sistemático dos
modelos de Recuperação da Informação
utilizados para Rastreabilidade de Software.
20. O Artigo
Eles não propõem um novo Modelo
A contribuição do artigo foi o amplo estudo
realizado sobre mais de 1000 trabalhos sobre
quais são os modelos de RI utilizados para
realizar Rastreabilidade
21. Perguntas da Pesquisa
RQ1 Quais modelos de Recuperação da
Informação e estratégias de aprimoramento
(enhance) são mais utilizadas para fazer
rastreabilidade em artefatos de software em
Linguagem Natural?
22. Perguntas da Pesquisa
RQ2 Quais os tipos de artefatos em Linguagem
Natural que são ligados com maior frequência
em estudos de Rastreabilidade com
Recuperação da Informação?
23. Perguntas da Pesquisa
RQ3 Quão forte são as evidências com relação
ao grau de realismo das avaliações dos sistemas
de Rastreabilidades feito com Recuperação da
Informação?
25. Trabalho Relacionados
• IR-Based Trace Recovery
– Borillo et al. 1992
Os mais relevantes
• O primeiro trabalho a utilizar técnicas de
Processamento de Linguagem Natural e Inteligência
artificial para rastreabilidade.
26. Trabalho Relacionados
• IR-Based Trace Recovery
– De Lucia et al. (2002 – 2014)
Os mais relevantes
• Criação de N ferramentas de Rastreabilidade por RI.
• SCOTCH: Slicing and COupling based Test to Code trace
Hunter (2014)
– Rastreabilidade entre Classes do Sistema e Classes de Testes
– Uso de Stop Class
– Conceptual Coupling Between Classes (CCBC)
27. Trabalho Relacionados
• IR-Based Trace Recovery
– Baeza-Yates R, Ribeiro-Neto B. (2011)
Os mais relevantes
• Pré-processamento
• Tratamento de camelCase, under_score convention,
etc.
28. Trabalho Relacionados
Os mais relevantes
• Previous Overviews on IR-Based Trace
Recovery
– Mapeamentos Sistemáticos sobre Rastreabilidade
e RI
– Cleland-Huang et al. (2012)
– De Lucia (2009 – 2012)
– “Nossa análise é mais estruturada e vai mais
fundo com um escopo mais estreito”.
30. Método de Pesquisa
Criação do Protocolo de
Pesquisa
Seleção das
Publicações
Extração de
dados e
mapeamento
das publicações
31. Método de Pesquisa
Criação do Protocolo de
Pesquisa
• Parâmetros para Inclusão de Artigos
Seleção das
Publicações
– Em inglês, Revisada por pares, Resultados
Empíricos sobre o tema.
• Parâmetros para Exclusão de Artigos
Extração de
dados e
mapeamento das
publicações
– Publicações que discutiam mais sobre outras
formas de rastreabilidade do que por RI.
– Publicações que discutiam sobre RI, mas falavam
pouco ou nada de rastreabilidade.
32. Método de Pesquisa
• Definição das bases de pesquisa
• Definição dos termos de Pesquisa
• Remoção de trabalhos duplicados
• Refinamento
– De: 1.241 publicações
– Para: 76 publicações
Criação do Protocolo de
Pesquisa
Seleção das
Publicações
Extração de
dados e
mapeamento das
publicações
33. Método de Pesquisa
Criação do Protocolo de
Pesquisa
Seleção das
Publicações
• Extração das contribuições das publicações
relevantes
• Mapeamento
Extração de
dados e
mapeamento das
publicações
35. Estado da Arte
Document Parsing, Extraction
and Pre-Processing
Corpus indexing with an IR
method
Ranked list generation
Enhance and Analysis of
candidate links
37. Document Parsing, Extraction and
Pre-Processing
• Stop words: a, an, to, it...
– Stop Class: java.lang.*, org.junit.*
• Stemming: produce, producing, produced,
producer
• ID Splitting: Tratamento de camelCase e
padrões de codificação
– Baeza-Yates R, Ribeiro-Neto B (2011)
• Google Translator
39. Indexing, Filtering and Retrieval
• Modelos Algébricos
– Relevância de um
documento para o
resultado de uma consulta
depende da sua
semelhança com o termo
procurado
– Uso de formas algébricas
de representação de
semelhança.
– Ex.: Uso do Cosseno em
VSM
• Modelos Probabilísticos
– Qual a probabilidade desse
documento ser relevante
para essa pesquisa?
– Dado um termo de busca o
documento pode ou não
ser relevante
– O sistema não pode ter
certeza sobre o real status
de relevância do
documento.
Zhai C (2007) Abrief review of information retrievalmodels. Technical
report,University of Illinois at Urbana-Champaign
42. Enhance and Analyze
• Relevance Feedback
– Há indícios de que humanos raramente
consideram mais de 10 links candidatos.
Borg M, Pfahl D(2011) Do better IRtools improve the accuracy of engineers’ traceability recovery? In:
Proceedings of the international workshop on machine learning technologies in software engineering,
pp 27–34
48. Minha Análise
• É um estudo bem abrangente sobre
Rastreabilidade através de RI.
• Serve como uma grande fonte de referências
de RI.
• Não se aprofunda em nenhum modelo
específico
– O que era esperado por se tratar de um SM.
– Mesmo assim ele apresenta o Estado da arte.