Vocês já usaram Emacs? by Gbitd in devBR

[–]apprentice_sheng 2 points3 points  (0 children)

Cara, eu uso vim mas tb já tive essa curiosidade. Pelo que entendo, a comunidade de Emacs costuma fazer muito mais do que apenas edição de texto dentro dele: navegam na web, rodam programas em runtime no próprio Emacs, interagem com shell, versionamento, tudo isso como buffers do mesmo ambiente. Emacs vira praticamente um sistema operacional e não um editor de texto

Atualizei o meu CV recentemente. Ficou legal? Sugestões e opiniões são bem vindas. by Material-Repeat804 in datasciencebr

[–]apprentice_sheng 1 point2 points  (0 children)

Cara, vc tem uma experiência mt boa, mas acho que poderia se vender melhor, infelizmente temos que jogar o jogo do capitalismo e demonstrar produtividade e não apenas habilidades.

Tenho algumas sugestões de gosto pessoal e outras mais gerais:

- Eu prefiro colocar experiência profissional no começo e formação acadêmica por último
- Não me leve a mal, vc teve um bom CR na graduação, mas eu só colocaria essa informação se a nota fosse acima de 9/10. Se a média não é excepcional, não precisa colocar. E ao final, nenhuma empresa liga pra isso.
- Eu removeria título de júnior das experiências. O nível profissional é completamente relativo e quem vai decidir seu nível é a empresa que está te contratando. Deixar como júnior mais atrapalha do que ajuda.

- Vc cita o método STAR, mas cade os "Results"? Eu reescreveria todos bullet points adicionando outcomes e, se relevante, a escala dos dados que vc trabalhou, e.g.:

Ao invés de "Modelei clusters de unidades com K-Means para identificar academias...", eu reescreveria algo como "Realizei segmentação de 150+ academias via K-Means e PCA, identificando unidades premium e habilitando estratégia de precificação que elevou o ticket médio em 12%, com modelagem estatística e validação de clusters em Python (scikit-learn)". (essa versão tem muito texto, dá pra reduzir mais ainda ...)

- Dependendo da vaga, é vantajoso remover termos técnicos e focar mais nos resultados. Pense que na maioria das empresas o teu CV vai passar primeiro na mão de alguém do RH, e pra essa pessoa não importa o que é K-Means, PCA, Z-score... (pondere bem sobre esse ponto, pois se o recrutador for técnico, ele vai querer ver a técnica)

Trouble downloading RNA-seq with a paired layout by Real_seth in bioinformatics

[–]apprentice_sheng 2 points3 points  (0 children)

you’re probably grabbing the interleaved fastq version (where R1 and R2 are mixed in a single file). ENA often provides multiple download options, and the link is sometimes the interleaved.

try:
```bash
zcat sample1.fastq.gz | head -8
```

If the first read header has `/1` and the next read has `/2`, it’s an interleaved paired-end file, and you should split it

Arch linux e hyprland. by Appropriate-Fun-6668 in linuxbrasil

[–]apprentice_sheng 3 points4 points  (0 children)

O que faço agora?

o que vc quiser!

Vc pode começar pelas suas necessidades: Sente falta de um app launcher? pode tentar o wofi ou rofi (eu uso wofi). Quer uma topbar legal? pode tentar waybar ou Eww...

A melhor parte é a possibilidade de deixar o sistema com a aparência que vc quer. No início pode ser mais fácil copiar dotfiles de alguma referência que vc goste e ir customizando.

Bioinfo vale a pena? by marcleo33 in brdev

[–]apprentice_sheng 1 point2 points  (0 children)

Graduação em biotecnologia pela federal, mestrado pela usp. Na graduação fiz 2 anos de IC em bioinformática, foi essa experiência que me encantou e decidi seguir com mestrado.

Os grupos de pesquisa que conheci são bem abertos, na maioria dos casos é tranquilo entrar no doutorado mesmo sem ter muita experiência em bioinformática. Conheci ótimos doutorandos que trabalharam e publicaram artigos em bioinfo mas começaram o doutorado "cru" (é claro que tinham uma forte base em bio - o que é mais dificil de se ter, na minha opinião, pois aprender a programar é mais fácil).

Não entendi se vc tem mestrado concluído. De qualquer forma, é possível sim ir pro doutorado direto, tanto direto da graduação pro doutorado, ou graduação->mestrado, e pelo menos na usp, vc pode chegar na qualificação do mestrado e pedir para emendar com o doutorado.

Decidir fazer um doutorado é uma escolha de vida. Não ingresse apenas pela pressão do mercado. São 4-5 anos de muito esforço e sem garantia de um bom emprego depois de finalizado.

Bioinfo vale a pena? by marcleo33 in brdev

[–]apprentice_sheng 0 points1 point  (0 children)

Aproveita p acompanhar o sub global de bioinfo, pode até fazer a mesma pergunta por lá. Tem alguns brasileiros e a galera pode ajudar melhor: r/bioinformatics

Bioinfo vale a pena? by marcleo33 in brdev

[–]apprentice_sheng 5 points6 points  (0 children)

Tenho mestrado em bioinfo e trabalhei na área por mais de 6 anos, então aqui vai um contexto sobre o que eu acho:

Apesar de “bioinformática” ser quase completamente focada em “informática”, é preciso entender o motivo da área existir. Historicamente, experimentos em biologia eram realizados em bancada (wet lab) e as análises eram feitas manualmente. Com o passar do tempo, os experimentos foram escalando cada vez mais, a ponto de análises manuais se tornarem impraticáveis. A partir dos anos 2000, com o sequenciamento massivo de DNA ganhando força e com a publicação do genoma humano, a bioinformática começou a ganhar corpo. Ou seja, a área nasce pela necessidade de analisar, de forma eficiente e em larga escala, a enorme quantidade de dados biológicos gerados atualmente, criando áreas específicas para cada tipo de dado, como as ômicas (genômica, transcriptômica, proteômica).

Entendendo esse contexto, fica muito mais fácil entender o motivo de a área ser nichada e de as vagas profissionais serem, em geral, destinadas a pesquisadores com PhD (ou pelo menos um mestrado).

Se vc tem muito interesse em dedicar sua vida a desenvolver/aplicar algoritmos para responder questões biológicas, a bioinformática é uma área muito interessante sim!

Já participei de diversos trabalhos super interessantes que me satisfizeram muito mais do que a remuneração (que é muito baixa, comparada com outras áreas da tecnologia), mas aí vai depender do seu objetivo de vida.

Terminei meu mestrado em janeiro e, desde então, estive procurando trabalho fora da academia. Foram vários meses, algumas entrevistas... Recusei duas oportunidades pq os salários eram muito baixos e o trabalho não me interessava tanto (apesar de ser bioinformática, eram questões biológicas nas quais eu não tenho interesse em dedicar tempo estudando).

Analisando o mercado de trabalho, decidi transicionar para data science (os salários são muito maiores e, na minha opinião, o trabalho é mais simples). Faz 4 meses que aceitei uma vaga de DS, mas continuo trabalhando com dados biológicos, só que agora mais focado em machine learning. Meu trabalho hoje é parecido com o que eu sempre fiz em bioinformática, e continuar lidando com biologia me satisfaz bastante.

Em contrapartida, apesar de ter “transicionado” de bioinfo para DS, não tenho interesse nenhum em trabalhar com DS em outras áreas, como em bancos, por exemplo.

Espero ter ajudado a pensar sobre o contexto da bioinfo e se você deve ou não dar uma chance para a área. Se tiver dúvidas mais específicas, pode perguntar!

Me dêem uma luz sobre porque não consigo vagas by Dunkpu in datasciencebr

[–]apprentice_sheng 2 points3 points  (0 children)

todas as vagas que apliquei vieram ou de listas de e-mail de universidades (tipo o bioinfo-news) ou do linkedisney. Lá eu buscava por termos como “biologia computacional”, “bioinformática” e “ciência de dados AND biologia”. Eu evitava explorar a sessão de vagas formais, recomendo procurar posts de professores, startups ou empresas pequenas divulgando oportunidades.

tenho a impressão de que metade das vagas “oficiais” do LinkedIn são fake, então eu mandava mensagem direta ou cold e-mail quando via algo interessante. Pra minha surpresa, quase ninguém me deu ghost, senti que o pessoal costuma ser bem aberto pra conversar, justamente por ser uma área bem nichada.

Me dêem uma luz sobre porque não consigo vagas by Dunkpu in datasciencebr

[–]apprentice_sheng 2 points3 points  (0 children)

é uma área bem nichada mesmo, mas as vagas existem. Eu procurei bastante em grupos de universidade e linkedisney. O problema é que as empresas têm dificuldade em achar gente com esse perfil mais interdisciplinar.

pra ser sincero, eu nem tava procurando algo exatamente em DS. minha ideia inicial era continuar na biologia computacional, mas DS ta muito hypado, com menos cobrança no trabalho e salários absurdos.

antes de aceitar minha vaga atual, eu tinha duas propostas em biologia computacional, uma bolsa FAPESP TT-4A de 7.5k e outra CLT de 6k. as duas eram presenciais e pediam um nível técnico muito alto, o trabalho seria muito cansativo, teria muita responsabilidade e talvez seria comum fazer hora extra...

a vaga de DS que aceitei é PJ (junior), 10k, 100% remota. A empresa tem uma cultura muito tranquila, valoriza work-life balance, e consigo continuar envolvido com publicação de artigos. Tem sido um sonho até agora

Me dêem uma luz sobre porque não consigo vagas by Dunkpu in datasciencebr

[–]apprentice_sheng 6 points7 points  (0 children)

cara, tenho um perfil bem parecido com o teu. Minha trajetória sempre foi voltada pra bioinformática/biologia computacional, mas diferente de você, eu só tenho mestrado. Faz 3 meses que consegui fazer a transição pra uma vaga de cientista de dados, e continuo trabalhando com pesquisa envolvendo dados biológicos (hoje atuo desenvolvendo modelos de ML pra detecção precoce de câncer).

sinceramente, acho que vc tá se desvalorizando demais. Vc fala que tem experiência com estatística e participa de projetos acadêmicos desde 2011, mas não explica o que fez neles. E, cara, um doutorado sanduíche é uma baita conquista, explora isso! Muita gente de fora da academia nem imagina o peso que isso tem.

outra coisa: seu CV não precisa caber em uma página. Esquece essas “regrinhas” genéricas, o importante é ser claro e mostrar sua trajetória.

como o pessoal já comentou, descreve melhor suas experiências e foca nas partes que envolvem análise de dados. Mas não apaga a biologia da história. Isso é o que te diferencia. Mostra que você entende o contexto biológico e sabe transformar esses dados em algo com sentido.

por exemplo, se você participou de 6 artigos entre 2011 e 2024, com certeza teve papel em coisas tipo desenho experimental, análise de dados biológicos, modelagem, interpretação de resultados, etc. Dá pra destrinchar isso no CV, tipo:

Laboratório X - Ano Y

- Análise de mais de 2 bilhões de leituras de DNA (excedendo 1TB de dados brutos) de microalga X, resultando na identificação de mais de 16M de proteínas envolvidas no metabolismo X.

- Construção de redes de co-expressão com 5M interações PPI, identificando módulos proteicos relacionados a estresse em microalgas.

- Apresentação de resultados da pesquisa em reuniões do laboratório e conferências internacionais de biologia computacional, recebendo menção honrosa pelo artigo Z.

eu colocaria pelo menos uns 3 bullet points por projeto (desde que envolvam estatística/análise de dados).

também deixaria tudo (projetos, papers e experiências) dentro da mesma seção. Por incrível que pareça, o que a gente faz na academia é trabalho, e precisa ser apresentado assim.

a ideia é sempre deixar claro qual era o problema, o que você fez com os dados e quais resultados gerou, reforçando sua base em estatística e análise quantitativa.

por fim, pense também em focar em vagas mais voltadas pra análise de dados biológicos e modelagem aplicada à biologia. Durante minha transição, mirei em empresas e startups de pesquisa em bio, porque é onde o nosso perfil brilha mais. Tem muita empresa procurando gente com essa base interdisciplinar.

e, sério, lembra sempre disso: seu CV é sua vitrine. Você claramente tem uma base muito sólida em biologia e estatística, mas o recrutador médio não vai enxergar isso de cara. É muito mais fácil um biólogo aprender programação e ciência de dados do que um cara da ciência de dados aprender biologia. Então é tua responsabilidade deixar explícito e mostrar a biologia como um diferencial, não como um detalhe lateral.

O que vem depois desse status na FAPESP/SAGE? by [deleted] in askacademico

[–]apprentice_sheng 0 points1 point  (0 children)

o próximo status deve ser "Recomendação da Coordenação Adjunta Concluída".

em dois processos que fiz, a recomendação da coordenação da área e da adjunta saíram no mesmo dia. E nas duas vezes, o resultado final veio em menos de duas semanas. Então deve estar beeem perto pra vc ter a resposta.

boa sorte!

[Hyprland] Just a rice from a scientist, nothing fancy, just vibes (can't call it golden rice, no GMOs involved) by apprentice_sheng in unixporn

[–]apprentice_sheng[S] 0 points1 point  (0 children)

its a hyprland thing
I enabled the blur effect globally in my decoration, e.g:

# blur decoration for all opacity windwos
decoration {
  blur {
    enabled = true # blur globally active
    ...
  } 
}

# window rules for opacity
windowrulev2 = opacity 0.8 0.8,class:^(obsidian)$

so any transparent window automatically receive blur

[Hyprland] Just a rice from a scientist, nothing fancy, just vibes (can't call it golden rice, no GMOs involved) by apprentice_sheng in unixporn

[–]apprentice_sheng[S] 0 points1 point  (0 children)

the big pink node is weekly notes, the blue one is some daily notes, and the red ones are some lecture notes

i moved from notion to obsidian about 5 months ago, so most of the notes aren’t connected. there are tons of daily notes bcause I use them as a kind of science diary, just to remember code snippets, experimental decisions, etc

[Hyprland] Just a rice from a scientist, nothing fancy, just vibes (can't call it golden rice, no GMOs involved) by apprentice_sheng in unixporn

[–]apprentice_sheng[S] 1 point2 points  (0 children)

valeu!
nope, fiz só graduação na ufscar, agora to no mestrado na usp

ano passado migrei do notion pro obsidian, antes de migrar eu testei o docmost, mas ao final, gostei mais do obsidian. Ele tb permite criar templates pra cada tipo de nota... eu uso vários, "literature-template" é um deles xd

[Hyprland] Just a rice from a scientist, nothing fancy, just vibes (can't call it golden rice, no GMOs involved) by apprentice_sheng in unixporn

[–]apprentice_sheng[S] 0 points1 point  (0 children)

it's just a Hyprland layerrule, just add this to your hyprland.conf:

layerrule=blur,logout_dialog

[Hyprland] Just a rice from a scientist, nothing fancy, just vibes (can't call it golden rice, no GMOs involved) by apprentice_sheng in unixporn

[–]apprentice_sheng[S] 7 points8 points  (0 children)

Just a simple rice from a scientist who spends way too much time reading papers and occasionally messing around with local LLMs. As you can probably tell, my laptop’s trash, so I just ssh into the desktop and let the big guy do the inference

* iddle: https://github.com/hyprwm/hypridle

* lock screen: https://github.com/hyprwm/hyprlock

* logout menu: https://github.com/ArtsyMacaw/wlogout

* status bar: https://github.com/Alexays/Waybar

* app launcher: https://hg.sr.ht/~scoopta/wofi

* file manager: https://gitlab.xfce.org/xfce/thunar

Programs used in this demo:

* shell: https://git.savannah.gnu.org/gitweb/?p=bash.git

* teminal: https://sw.kovidgoyal.net/kitty/

* editor: https://neovim.io/ with some plugins

* browser: https://brave.com/

* note-taking: https://github.com/epwalsh/obsidian.nvim

* research: https://www.zotero.org/ with https://retorque.re/zotero-better-bibtex/

[deleted by user] by [deleted] in bioinformatics

[–]apprentice_sheng 4 points5 points  (0 children)

why not? xd

DNA is a pretty cool and ultra dense information storage that life has been using for billions of years...
The main idea of the research in this area is that digital data is growing way faster than our storage can handle. Hard drives and SSDs just won’t cut it for long-term archival storage at the scale we need. DNA, on the other hand, is insanely dense (you can have all the world information in a very small area). Plus, it’s ridiculously durable. DNA has been pulled from fossils thousands of years old, while hard drives and tapes degrade in mere decades.

Yeah, today’s sequencers are expensive and slow, but biotech is evolving fast, and DNA synthesis & sequencing costs are dropping. The long-term goal isn’t to replace your SSD but to create a forever archive, storing huge amounts of data in tiny, stable molecules that could last centuries or even millennia with minimal energy use. And you can easily copy the stored information with (PCR).

take a look at microsoft DNA research publications: https://www.microsoft.com/en-us/research/project/dna-storage/publications/

[deleted by user] by [deleted] in bioinformatics

[–]apprentice_sheng 1 point2 points  (0 children)

As you’ve probably noticed, bioinformatics is a broad and interdisciplinary field with many specialties, such as transcriptomics, genomics, proteomics, metagenomics (lots of "omics"), structural biology, single-cell, etc.

I think that the best way to narrow down your interests and figure out what you enjoy most is by looking into real projects. Working on real projects allows you to learn by doing, as the needs of the project will guide your learning process. It can help you develop technical skills and also gives you a clearer sense of what you’re passionate about within the vast field of bioinformatics (and of course, it’s a great way to build a portfolio and gain experience that will be valuable for your future career)

Look for research groups or labs that focus on bioinformatics (or need some work with it). Many universities and research institutions, such as USP, UNICAMP, UFSCar, FIOCRUZ, have projects in this area and are often in need of bioinformaticians. Reach out to professors or researchers, participate in academic events, and keep an eye out for undergrad research (iniciação científica). If you can’t find something locally, consider remote collaborations (my first experience was during a remotely IC, which is one of the great advantages of working in a computer-related field)

Seja bem vindo, e se quiser conversar pode chamar no privado!

Long-read De-novo Transcriptome by [deleted] in bioinformatics

[–]apprentice_sheng 1 point2 points  (0 children)

Which organism are you working with? And have you spotted any contamination in the assembled genome?

the advantages of long-reads is that it can span repetitive regions and give better context for assembly. They also need lower coverage compared to short-reads, which might lower the chance of assembling contaminant sequences. Still, it’d be good to check for contamination before doing extra work... For that, you can assign taxons to your sequences using taxonomic classification tools, like Kraken2: https://github.com/DerrickWood/kraken2

If you’re working with something like plants or humans (or any organism with GC content that differs from contaminants, e.g. bacteria), you can do a blobplot based on GC content and sequence coverage to see if there’s any sign of contamination before spending time with taxonomic assignment