Análise Social Media Week

Análise Social Media Week

Análise Social Media Week

1 Comment on Análise Social Media Week

O Social Media Week SP está chegando e a parte inicial da curadoria está sendo feita por crowdsource: qualquer um pode votar em qualquer número de palestras, o que transforma a coisa toda numa espécie de jogo. E, como em qualquer jogo, eu quero saber minhas chances! Analista de dados não deixa perguntas sem responder: mãos à obra.

Do zero: estratégia

A primeira coisa a ser feita é ter uma base limpa e estável para analisar; o que gostaríamos é ter os seguintes dados para analisar, de cada uma das palestras:

  • descrição
  • autor
  • tags
  • número de likes
  • número de comentários

Tudo seria colocado em arquivos .csv para que eu possa parsear e fazer análises mais facilmente. Para isso, escrevi um script em python que abre cada uma das categorias, de lá, abre cada uma das palestras, captura os dados e os guarda nos arquivos para análise posterior. O script e os arquivos que eu usei na análise estão todos num repositório do GitHub (use por sua conta e risco).

Algumas regras importantes desta base:

  • Ela pode não estar completa. Eu parti da tagcloud disponível no site e eliminei todas as palestras que davam algum tipo de erro
  • Cada palestra pode ter até 3 tags, mas não necessariamente as 3
  • A organização do site recentemente fez um “expurgo” na base, eliminando tags que só tinham uma palestra ou tags onipresentes (como social media)

Primeiro, o básico

A primeira coisa em qualquer análise é ter uma noção básica de onde estamos. Então, o que sabemos rapidamente sobre a base?

  • 390 palestras
  • 329 categorias
  • 361 palestrantes
  • 14.411 likes
  • 5.561 comentários

Isso nos dá alguns números derivados muito interessantes:

  • 1,18 palestras por categoria
  • 1,08 palestras por palestrante
  • 36,95 likes por palestra
  • 14,25 comentários por palestra

Ok, agora temos algo contra o que comparar. Façamos coisas mais interessantes…

 

Segundo, distribuição

Agora que sabemos de maneira ampla o que estamos olhando, demos atenção a algumas distribuições. Comecemos por “Palestras por Categoria”:

Tag/categoria Nº de palestras
conteúdo 39
digital 34
empreendedorismo 32
comportamento 27
influenciadores 25
estratégia 24
comunicação 23
educação 21
inovação 20
negócios 20
vendas 19
branding 17
planejamento 17
inteligência artificial 14
tecnologia 14
engajamento 13
gestão 13
coaching 12
crises 12
métricas 12
(outras) 650

OK, essa não foi uma boa ideia: temos categorias demais e palestras de menos para ver isso fazer sentido. Era algo óbvio, no entanto: temos uma média de 1,18 palestras por categoria; uma pulverização grande demais para ser analisada desse jeito. Mas podemos ver de maneira mais interessante: quantas categorias tem cada quantidade de palestras?

Ok, agora temos uma boa explicação para a dispersão enorme: a maior parte das categorias tem até 2 palestras; ou seja, as categorias estão dizendo pouca coisa. Uma vez que as categorias são tratadas como tags, cada palestra podendo ter até três delas, podemos ver que temos, na verdade, uma grande quantidade de tags irrelevantes.

No entanto, isso gera uma situação interessante: ter uma palestra numa categoria “isolada” deixa a sua palestra mais fácil de ser encontrada: em “big data”, por exemplo, há apenas seis palestras. Qualquer um interessado em Big Data provavelmente verá todos os candidatos a palestrar sobre aquele assunto. Enquanto a tag fica pequena na tagcloud, uma categoria imensa, como “conteúdo”, pode atrair muitos cliques, mas suas 80 palestras tornam improvável que a palestra de Mariana Cobra seja vista e receba votos, principalmente porque a ordenação do site é dos mais populares (likes) para os menos.

Mas e como se comportam os likes?

IMAGEM

Podemos ver que temos uma clara elite: 90% das palestras tem até 100 likes, com 72% das palestras tendo até 50 likes; ou seja: temos uma parcela enorme de palestras que não estão sendo curtidas – ou vistas.

Em suma, se a sua palestra rompeu a barreira dos 110 likes, fique tranquilo: você está entre os poucos dos poucos. Se seu nome é Henry Suzuki, você está isolado no topo.

 

Terceiro, relacionamento

Mas e como as tags se relacionam? Será que temos um grupo de tags que são desnecessárias?

O cruzamento não é trivial, mas trás algumas notas interessantes no meio de seus 106.276 cruzamentos:

  • Todas as tags tem pelo menos um cruzamento: ou seja, nenhuma tag existe em apenas uma palestra
    • Curiosamente, 24 palestras tem apenas uma tag. Parece que nem todo mundo concorda com essa coisa de “dar mais de uma categoria” às suas palestras
  •  211 tags existem apenas juntamente com outra tag
    • Exemplo: todas as tags de “marketing musical” também são palestras de “música” Nem todas as palestras de “música” são de “marketing musical”, no entanto
  • “Conteúdo” é a tag mais usada e também a mais cruzada, com 48 cruzamentos diferentes em 39 palestras
    • “educação” e “influenciadores” são as que cruzam mais frequentemente com “conteúdo”, com 4 palestras em cada
      • antes que alguém pergunte, “educação” e “influenciadores” nunca se cruzam (pessoalmente, eu acho que educação e influenciadores nunca mais vão aparecer na mesma frase de qualquer maneira)
  • “Digital” concentra os dois maiores cruzamentos: “comportamento” e “comunicação”, com 6 palestras usando cada uma das combinações

Os cruzamentos de likes trazem algumas outras informações, mas devem ser lidos com cuidado, devido à maneira como temos que fazer os cálculos: cada cruzamento de tags soma todos os likes das palestras que ali cabem. O que significa que, quando somamos os likes das palestras de uma tag, estamos somando várias vezes os likes dos cruzamentos. Com isso, somar os cruzamentos vira uma métrica inútil, pois não pode ser deduplicada.

  • A maior cruzamento tem 353 likes entre 5 palestras de “planejamento” e “estratégia”
  • A maior média de likes por palestra num cruzamento, com 284 likes, são:
    • inovação/business intelligence
    • inovação/insights
    • insights/business intelligence
    • Tudo isso por causa de uma única palestra, do Henry Suzuki (de novo)

E isso tudo é muito bom e interessante, mas análise sem objetivo não tem graça. Então façamos algo divertido com esse conhecimento.

 

Quarto, teoria dos jogos

Finjamos por um momento que as palestras são escolhidas exclusivamente por número de likes. Então, para sua palestra ser aceita, sua melhor estratégia é conseguir o maior número de likes possível.

Em tempo: a curadoria reserva-se o poder de colocar ou eliminar palestras como necessário para manter a coesão do evento, e isso é perfeitamente OK. Só vou ignorar isso pois é uma parte imprevisível do processo, e não há estratégia a ser montada em cima disso, fora o que comentarei.

Comecemos, então, por alguns requerimentos óbvios, mas que são sempre importantes de lembrar:

  • Tenha um tema bom, alinhado com o evento, que seja relevante para o público; este é um evento de social media, então tenha ligações óbvias com comunicação, redes, comunidade
  • Saiba do que você está falando: não adianta tentar fingir; a curadoria é de professores qualificados e que sabem o que está acontecendo. Só juntar um monte de buzzwords não vai te dar likes, muito menos ajudar a passar pela banca
  • Tenha uma boa descrição e foto, pois é isso que as pessoas verão de relance e te julgarão em frações de segundo
  • Lembre-se do networking. Se a ideia é conseguir votos, lembre-se dos amigos e colegas de trabalho

Dito isso, o que eu consideraria uma estratégia válida para ter a maior quantidade possível de likes na sua palestra logo no início:

  1. Cumpra os requisitos logo acima
  2. Não coloque a sua palestra imediatamente. Deixe pelo menos metade do período de inscrição e votos terminar. Isso vai permitir que a rede te dê indícios do que fazer
  3. Puxe os dados, assim como eu fiz para essa análise. Não acredito que o script funcionará para os próximos anos, mas já é um começo 🙂
  4. Escreva a sua palestra com cuidado, atentando para o conteúdo.
  5. Aqui come a estratégia real; selecione suas tags:
    1. Vamos colocar duas tags “perfeitas” e uma “de jogo”
    2. As duas primeiras tags devem ser direta e perfeitamente ligadas ao seu conteúdo. Não importa se elas são péssimas para ser notado, mas sim que elas são ligadas ao conteúdo da sua palestra
    3. Com os dados em mãos, balanceie categorias entre:
      • quantidade total de likes: quanto maior, melhor, pois a categoria aparecerá maior no wordcloud
      • quantidade mínima de likes para estar no top 6: quanto menor, melhor, pois sua chance de estar no topo e ser visto quando alguém visitar a página da tag. Pessoalmente eu calculo isso com um vetor entre as duas métricas, dando peso 2 para os likes (veja a aba “Categorias” do XLS no repositório).
      • Para a situação atual, teríamos:
      • Tag/categoria Índice de Atratividade
        conteúdo 1,99
        empreendedorismo 1,5
        digital 1,47
        comportamento 1,4
        influenciadores 1,36
        estratégia 1,29
        inovação 1,19
        negócios 1,1
        dados 1,1
        branded content 1,07
    4. Coloque a terceira tag sendo algo que se relaciona com o conteúdo da sua palestra, mas focado na atratividade da tag. competir em “conteúdo” seria muito arriscado, mas “digital” ou “comportamento” pode ser muito mais fácil: isso te dá uma chance maior de ser visto e, portanto, votado.
  6. Divulgue sua palestra! Há diversos grupos no Facebook que podem se interessar, há vários círculos onde você pode postar a sua palestra sem fazer dela spam. As categorias que mais estão correndo te darão um indício de onde publicar: Conteúdo está ganhando? Diversos grupos e fóruns de produtores de conteúdo estão dispostos a votar e assistir uma palestra relevante. Uma palestra monopoliza os likes? Veja onde o autor é discutido e embrenhe-se lá.

Tem muito mais coisa que podemos fazer com os dados. Mas isso me leva a um ponto importante…

 

Quinto, responsabilidade

Dados são poderosos. Podemos fazer muita coisa com eles e transformar a extremamente bem-intencionada votação do Social Media Week num jogo onde quem tem mais dados tem uma chance desproporcional de ganhar. E isso não é legal.

É por isso que eu estou postando isso agora a menos de uma semana do fim das inscrições e votos: será muito difícil alguém se beneficiar demais destas informações.

Mas é muito simples só segurar a informação e não ajudar a fazer o futuro. Então, seguem algumas sugestões de como o Interney e equipe podem fazer diferente no ano que vem:

  • Fechem as categorias
    Usando as tags desse ano e o cruzamento entre elas, podemos fazer uma lista reduzida de categorias, sob as quais as palestras podem ser colocadas
  • Mesmo assim, aceitem sugestões
    Para não tirar o caráter criativo e colaborativo da criação de palestras, deixem que os palestrantes sugiram um tema sob o qual a sua palestra pode entrar, o que seria revisado por humanos
  • Curadoria contínua
    O melhor jeito de deixar isso menos parecido com um jogo é não ter regras: uma curadoria contínua, que vetasse palestras não-relacionadas ao mesmo tempo em que sugerisse mudanças de categoria para as palestras, seria o melhor jeito de mandar o sinal de “não abuse”

 

Por fim, algumas notas

Algumas coisas podem ter ficado no ar, então vai aqui um pequeno P&R:

Porque você não analisou dislikes ou comentários?

Pois trazia poucas informações. Os dislikes eram poucos, os comentários sempre “Quero muito ver a palestra” ou “palestrante bom, estou empolgado!”. Não ia trazer nem vantagem quantitativa, pois a correlação com os likes é muito grande, nem qualitativa, pois não tem polaridade nem assuntos

 

Você tem outras análises que não entraram aqui?

Várias, mas todas focadas em descobrir o quão bem a minha palestra estava, e não encontrar trends. Não vale a pena mostra-las pois a demonstração fica redundante com outras que estão aqui (como a concentração de palestras por número de likes) ou simplesmente não são interessantes (comparar temas com palestras que tem aproximadamente a mesma quantidade de likes).

 

E agora?

Agora que mostrei que sei o que faço, que tal o seu like na minha palestra? Ou um comentário aqui no post? Talvez baixar a planilha no Github e provar que estou errado (comentando aqui embaixo de maneira educada)?

About the author:

Related Posts

  • Sheyna

    Bem! Eu não posso mais analisar números, pois o que manjva de criar fórmulas, na unha, acho que devo ter perdido, e enfim. Fui analisar alguns perfis e palestrantes!

    Gente com enredo de que trabalha com eventos, cita N cias, ou seja, muita gente envolvida na história da pessoa, e 1, ou 15 likes!

    Eu mesma, faço parte de uma rede com 5 mil membros. 6 dúzia votou! (destes 5 k). Ou seja, todo mundo só quer pavê! Ou pacumê?!

    O que é engajamento, na real, hoje em dia?!
    Neste caso, claro, são cliques.

    Mas, em páginas de Facebook, por exemplo. Pra mim, vai além dos cliques e curtidas. E sim do quanto os fãs, curtidores, e menos ainda, seguidores, engajam! Ah! Fiquei feliz, descobri que 100% dos meus curtidos em minha SAA PRODUÇÕES MULTICULTURAIS, seguem a página! Mas isso não me garante lá tanto engajamento quando posto! Embora, eu tenha criado a página, só em função de ter uma landing page pra mim, sem ser um site, ainda!

Back to Top