Friday 10 November 2017

Recode string variable to numeric in stata forex


Bem-vindo ao Instituto de Pesquisa e Educação Digital NOTA: Esta página foi desvinculada. Ele não está mais sendo mantido, e as informações nesta página podem estar desatualizadas. Como esta página foi desvinculada, não podemos responder a perguntas relacionadas a esta página. Stata FAQ: Como converter variáveis ​​de cadeia para variáveis ​​numéricas no Stata A maneira mais fácil de converter variáveis ​​de cadeia para formato numérico é usar o comando codificar. Se a variável é realmente um valor numérico que apenas acontece de ser armazenado como uma Cadeia de caracteres, consulte o nosso FAQ: Como posso converter rapidamente muitas variáveis ​​de seqüência de caracteres para variáveis ​​numéricas Vamos dizer que você tem os seguintes dados: Vamos começar por ler no conjunto de dados de A Internet e usando o comando descrever. A região variável é uma variável de cadeia. Em seguida, vamos fazer um tabulate na região. Agora vamos usar o comando codificar e outro descrever. O comando codificar gerou uma nova variável chamada região2 que é do tipo inteiro longo e tem etiquetas de valor que são definidas e também são chamadas de região2. Agora vamos fazer dois tabulate s, um com etiquetas e um sem rótulos. O primeiro tabulate parece idêntico ao tabulado feito na região variável de seqüência acima. Como você pode ver na segunda tabulação. Region2 tem os valores numéricos de 1 a 4, mas mantém as cadeias Central, Leste, Sul e Oeste como etiquetas de valor. O conteúdo deste site não deve ser interpretado como um endosso de qualquer site específico, livro ou produto de software pela Universidade da Califórnia. Bem-vindo ao Instituto de Pesquisa Digital e Educação Stata FAQ Como posso converter rapidamente muitas variáveis ​​de seqüência de caracteres para Variáveis ​​numéricas Pode haver vezes que você recebe um arquivo que tem muitos (ou todos) das variáveis ​​definidas como seqüências de caracteres. Ou seja, variáveis ​​de caracteres. As variáveis ​​podem conter valores numéricos, mas se forem definidas como tipo string. Há muito poucas coisas que você pode fazer para analisar os dados. Você não pode obter os meios, você não pode fazer uma regressão, você não pode fazer uma ANOVA, etc Às vezes, o conjunto de dados contém valores numéricos que são armazenados como seqüências de caracteres. Iremos abordar este cenário primeiro. Em seguida, abordaremos o caso em que as variáveis ​​de string realmente contêm strings eo objetivo é atribuir cada valor que a string assume em um valor numérico. Todos os exemplos nesta página usam o mesmo conjunto de dados, então vamos começar examinando os dados. O exemplo de conjunto de dados, hsbs. É um subconjunto do arquivo de dados High School e Beyond com todas as variáveis ​​como variáveis ​​de string. Como você pode ver a partir do comando descrever abaixo, as variáveis ​​são todas definidas como variáveis ​​de cadeia (por exemplo, science é str2, uma string de comprimento 2). Agora que sabemos que as variáveis ​​são variáveis ​​de string, podemos usar o comando list para ver como as strings armazenadas nessas variáveis ​​se parecem. Embora a ciência variável é definida como str2, você pode ver na lista abaixo que contém apenas valores numéricos. Mesmo assim, porque a variável é definida como str2, Stata não pode realizar qualquer tipo de análise numérica da ciência variável. O mesmo é verdadeiro para a variável read. Convertendo variáveis ​​de seqüência com valores numéricos Um método de converter números armazenados como seqüências de caracteres em variáveis ​​numéricas é usar uma função de seqüência de caracteres chamada real que converte valores numéricos armazenados como seqüências de caracteres em valores numéricos Stata pode reconhecer como tal. A primeira linha de sintaxe lê no conjunto de dados mostrado acima. O segundo gera uma nova variável readn que é igual ao valor do número armazenado na variável string read. O real (s) é a função que converte os valores mantidos como strings, onde s é a variável que contém strings. Um segundo método para alcançar o mesmo resultado é a destruição do comando. Vamos tentar usar o comando destring e ver como ele funciona. A primeira linha de sintaxe carrega o conjunto de dados novamente, de modo que estamos começando com um conjunto de dados contendo apenas variáveis ​​de cadeia novamente. A segunda linha de sintaxe executa o comando destring. Como você pode ver a partir do comando descrever abaixo, o comando destring converteu todas as variáveis ​​para numeric, exceto para race. Gênero e schtyp. Como essas variáveis ​​tinham caracteres nelas, o comando de destruição deixou tais variáveis ​​sozinhas. Se houvesse quaisquer variáveis ​​numéricas no conjunto de dados, elas permaneceriam inalteradas. Ambas as técnicas descritas acima têm atributos que em algumas situações são vantagens e em outras situações podem ser desvantagens. O comando destring pode ser executado em um conjunto de dados inteiro em uma etapa, o método usando a função real requer a emissão de um comando para cada variável a ser convertida (embora isso possa ser feito com um loop em vez de digitar a sintaxe para cada variável). Uma vantagem potencial para usar a função real (o primeiro método) é que se a função real encontrar um valor não-numérico, ela define a variável igual a falta nesse caso e move-se. Em certa medida, a destruição pode ser feita para se comportar de forma semelhante, mas não de forma idêntica. Para converter uma variável de cadeia que contenha qualquer valor não numérico usando destring, é necessário listar os caracteres que devem ser ignorados (por exemplo, ou.). Além disso, ao invés de definir valores para aqueles casos que contêm valores não-numéricos para faltar (o que a função real faz), destring remove os caracteres não-numéricos especificados. Destring extrairá as seqüências de caracteres especificadas e, em seguida, converter, o que significa que a4 pode ser convertido em 4. destringir o comportamento s é muito bom se tiver valores numéricos armazenados como seqüências de caracteres que ocasionalmente contêm coisas como vírgulas (por exemplo, 4,354), mas pode haver situações onde Este comportamento é indesejável. Convertendo variáveis ​​de seqüência de caracteres com valores não numéricos em valores numéricos Como convertemos gênero e schtyp em valores numéricos Podemos usar o comando codificar como mostrado abaixo. Esses comandos criam gender2 e schtyp2. Observe no comando descrever abaixo que gender2 e schtyp2 são variáveis ​​numéricas e eles têm rótulos associados a eles (chamados gender2 e schtyp2). Se listarmos os dados, parece que gender2 e schtyp2 são idênticos ao sexo e schtyp. No entanto eles são realmente numéricos eo que você está vendo são os rótulos de valor associado com as variáveis. Abaixo usamos a opção nolabel e você vê que gender2 e schtyp2 são realmente numéricos. E a variável raça. Ainda é uma variável de caractere porque nosso comando de destruição anterior viu o X nos dados e não tentou convertê-lo porque tinha valores não-numéricos. Abaixo podemos convertê-lo para numérico por incluir a opção de ignorar (X) que diz destring para converter a variável para numérico e quando ele encontra X para converter isso para um valor ausente. Você pode ver os resultados no comando de lista abaixo. Como você viu, podemos usar destring para converter variáveis ​​de seqüência de caracteres que contêm números em variáveis ​​numéricas, e pode lidar com situações em que alguns valores são armazenados como um caractere (como o X vimos com raça). Se você tem uma variável de caractere que é armazenada como todos os caracteres, você pode usar codificar para converter a variável de caractere para numérico e ele criará rótulos de valor que têm os valores que foram armazenados com a variável de caractere. Para obter mais informações, consulte a ajuda ou o manual de referência sobre os comandos destring e cod. O conteúdo deste site não deve ser interpretado como um endosso de qualquer site, livro ou produto de software específico pela Universidade da Califórnia. STRREC: módulo Stata para recodificar variáveis ​​de string de acordo com regras strrec recodifica variáveis ​​de string de acordo com regras. As variáveis ​​podem ser recodificadas em variáveis ​​numéricas ou em variáveis ​​de cadeia. Qualquer string em var que não atenda às condições de regras é definida como ausente em variáveis ​​numéricas criadas e copiada de var em variáveis ​​de cadeia criadas. Os rótulos de valor serão definidos para variáveis ​​numéricas. Strrec também pode ser usado para recodificar variáveis ​​numéricas de acordo com seus rótulos de valor. Se você tiver problemas ao fazer o download de um arquivo, verifique se você tem o aplicativo adequado para visualizá-lo primeiro. Em caso de problemas adicionais, leia a página de ajuda IDEAS. Observe que esses arquivos não estão no site IDEAS. Seja paciente, pois os arquivos podem ser grandes. Componente de software fornecido pelo Boston College Departamento de Economia em sua série Componentes de Software Estatístico com o número S457177. Ao solicitar uma correção, mencione, por favor, estes itens handle: RePEc: boc: bocode: s457177. Veja informações gerais sobre como corrigir material no RePEc. Para questões técnicas sobre este item, ou para corrigir seus autores, título, resumo, informações bibliográficas ou download, entre em contato: (Christopher F Baum) Se você é autor deste item e ainda não está registrado no RePEc, recomendamos que o faça aqui . Isso permite vincular seu perfil a este item. Ele também permite que você aceite citações em potencial para este item que estamos incertos sobre. Se as referências estiverem totalmente ausentes, você pode adicioná-las usando este formulário. Se as referências completas listarem um item que está presente no RePEc, mas o sistema não tiver vinculado a ele, você pode ajudar com este formulário. Se você souber de itens ausentes citando este, você pode nos ajudar a criar esses links adicionando as referências relevantes da mesma maneira como acima, para cada item referente. Se você é um autor registrado deste item, você também pode querer verificar a guia de citações em seu perfil, pois pode haver algumas citações esperando confirmação. Tenha em atenção que as correcções podem demorar algumas semanas para filtrar os vários serviços RePEc. Mais serviços MyIDEAS Seguir séries, jornais, autores e mais Novos artigos por e-mail Subscrever novas adições ao RePEc Registro de autor Perfis públicos para pesquisadores de Economia Rankings Vários rankings de pesquisa em Economia e campos relacionados Genealogia Quem foi um aluno de quem, usando RePEc RePEc Biblio Artigos curados artigos de amp papéis vários temas de economia MPRA Carregar seu artigo para ser listado em RePEc e IDEAS EconAcademics agregador de blogs para a pesquisa de economia Plágio Casos de plágio em Economia Papéis do mercado de trabalho RePEc série de papel de trabalho dedicado ao mercado de trabalho Fantasy League Pretend você está no leme De um departamento de economia Serviços do StL Fed Dados, pesquisa, apps amp mais do St. Louis Fed

No comments:

Post a Comment